یکی از مهمترین وظایف گوگل اینست که متن وارد شده در سرچ بار را خوانده و مقالات مرتبط با آن را با نظم خاصی با توجه به تخمین مرتبط بودن نشان دهد. بنا براین می توان گفت که گوگل تا حد خوبی می تواند متوجه منظور متن ها شود.

یکی از راه های گوگل برای متوجه شدن مربوطبودن یا نبودن صفحه سیگنال های استفاده کنندگان است. به این شکل که رفتار و انتخاب های مخاطبان و استفاده کنندگان از گوگل در جستجو های مختلف بررسی شده و بر اساس آن تصمیم گیری می شود. مثلا اینکه جستجو کننده پس از کلیک بر روی نتیجه، بر چه چیز های دیگری کلیک می کند بسیار اهمیت دارد. اما این فقط یک تعقیب کردن است و درک مفهوم نوشته محسوب نمی شود.

گوگل چگونه یم نوشته را درک می کند؟

حقیقت اینست که کسی با قطعیت نمی داند. این اطلاعات بسیار گرانقیمت هستند. اما سرنخ هایی از وقایع و با توجه به نتایج جستجوها داریم که ما را راهنمایی می کنند. آنچه مسلم است گوگل هر روز قدم های بزرگی در راستای درک مفاهیم صفحات وب برمیدارد. همچنین می دانیم که این موتور جستجو در تلاش است تا دریابد که کلمات و مفاهیم چه ارتباط هایی با هم دارند.

بیشتر بخوانید: سئو در مشهد

تعبیه کلمات (Word embeddings)

در این تکنیک موفقیت آمیز گوگل که در فرصت مناسب بیشتر در موردش خواهیم گفت، هدف اینست که روابط نزدیک کلمات با هم کشف شوند. اینگونه که یک پردازنده متنی را دریافت کرده و سپس بررسی می کند که چه کلماتی همراه با یکدیگر می آیند و تکرار می شوند. سپس هر کلمه را به به یک کد تبدیل و یا ((ترجمه)) می کند. بدین شکل کلمات می توانند برای الگوریتم ها قابل درک باشند.

کلمات در قالب کد در یک دیاگرام قرار می گیرند که ارتباط کلمات با هم را نشان می دهد. جدیدا به این دیاگرام فاصله کلمات هم اضافه شده است و یک گراف بزرگ شبیه کهکشان بما نشان می دهد که هر کلمه چقدر احتمال دارد با چه کلمه ای بیاید.

بطور جالبی این روش برای پاراگراف ها هم گسترش داده شده است. هرچه داده ها برای سیستم بیشتر شوند قابلیت درک معنا بیشتر می شود و نتیجه بسیار جالبتر خواهد بود. حال در نظر بگیرید که دیتابیس مورد استفاده گوگل کل اینترنت است. با دیتابیسی به این عظمت ایجاد مدل های قابل اعتماد که با دقت بالا معنای کلمات، جملات و عبارات را درک کرده و پیش بینی می کنند، ممکن شده است.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

اسکرول به بالا