محتواهای زبانه Explore اینستاگرام چگونه انتخاب میشوند؟
اینستاگرام اخیرا جزئیات تازهای پیرامون چگونگی استفاده این سرویس از یادگیری ماشینی به منظور نمایش محتوا به کاربران منتشر کرده و تاکید دارد که تمرکز آنها در هنگام پیشنهاد محتوا این است که نه به دنبال پستهای تکی بلکه به دنبال اکانتهایی باشند که فکر میکنند کاربران از آنها خوششان خواهد آمد.
این پست توضیحاتی اینستاگرام مباحث فنی مختلفی را مطرح میکند و به بررسی اتفاقات پشت صحنهای میپردازد که معمولا شرکتها از ارائه آنها اجتناب میکنند. هرچند شاید اینستاگرام به اندازه سایر پلتفرمهای اجتماعی مثل یوتیوب محتوای رادیکال و افراطی ارائه نکند، اما این سرویس هم مشکلات خاص خودش را دارد. محتواهای غلط و نفرتانگیز به اندازه سایر رسانههای اجتماعی در اینستاگرام دیده میشود و اپلیکیشن این شرکت گاها دارای مکانیزمهای نادرستی است.
با این حال، مهندسان اینستاگرام در این پست کارکرد زبانه Explore را توضیح دادهاند. ایوان مِدوِدف، مهندس نرمافزاری این شرکت، میگوید: «این نخستین باری است که میخواهیم جزئیات دقیقی را پیرامون بنای زیرساختی این سرویس ارائه کنیم، بنایی که به ما کمک میکند محتواهای شخصیسازیشده برای کاربران نمایش دهیم.»
اینستاگرام میگوید سرویس آنها بسیار بزرگ است و محتویاتی با تنوع فوقالعاده زیاد در آن وجود دارد. در نتیجه چالشی برای پیشنهاد محتوا به وجود آمده که اینستاگرام آن را نه با تمرکز بر پستهایی که کاربران ممکن است آنها را بپسندد، بلکه با تمرکز بر اکانتهایی که افراد احتمالا از آنها خوششان خواهد آمد، حل میکند.

اینستاگرام با روشی در یادگیری ماشینی موسوم به Word Embedding یا «توکاری کلمه» اکانتهایی را شناسایی میکند که مشابه یکدیگر هستند. سیستمهای توکاری کلمه ترتیب کلمات در متن را مطالعه میکند تا بفهمد که آنها چقدر با یکدیگر مرتبط هستند. برای مثال، یک سیستم توکاری کلمه میفهمد که واژهای مثل «آتش» معمولا در کنار واژههایی مثل «هشدار» و «کامیون» و به ندرت در کنار واژههایی مثل «پلیکان» یا «ساندویچ» ظاهر میشود. اینستاگرام از پروسه مشابهی برای تشخیص میزان مشابهت دو اکانت با یکدیگر بهره میگیرد.
سیستم زبانه Explore برای ارائه پیشنهادهای خود کارش را با بررسی اکانتهای Seed (یا بذری) آغاز میکند، اکانتهایی که کاربر در گذشته از طریق لایک کردن یا ذخیرهسازی محتواها با آنها تعامل داشته است. این سیستم اکانتهای مشابه را در این زمینه شناسایی و از هر کدام ۵۰۰ نمونه محتوا را جدا میکند. از این نمونهها برای حذف اسپم، اطلاعات غلط و احتمالا محتواهای ناقض حریم خصوصی استفاده میشود و سپس سایر پستها مبتنی بر میزان تعامل احتمالی کاربر با آنها ردهبندی میشوند. در انتها، ۲۵ پست برتر در صفحه نخست زبانه Explore کاربر به نمایش در میآید.
منتها در این جا لازم است به چند نکته اشاره کنیم. اینستاگرام شفافیت کاملی پیرامون پروسههای خود ندارد. هیچ جزئیاتی وجود ندارد که نشان دهد از چه سیگنالهایی برای تشخیص اسپم یا اطلاعات غلط استفاده میشود و البته طبیعی است، چون اگر این فرآیندها افشا شود، کاربران میتوانند آنها را برای انتشار محتواهای خود دور بزنند. علاوه بر این، مشخص نیست که تا چه میزان از یادگیری ماشینی برای فیلتر کردن محتواهای نامناسب استفاده میشود. فیسبوک قبلا گفته بود که هوش مصنوعی یکی از ابزارهای جادویی این شرکت برای مدیریت محتواهاست.
برای مثال نمونه محتواهای ضد واکسیناسیون را در نظر بگیرید. اینستاگرام این محتواها را عموما با کمک روشهای دستی حذف میکند. مثلا هشتگهایی که مشمول شاخصه «اطلاعات غلط قابل تایید» هستند نظیر vaccinescauseaids# از دسترس خارج میشوند. از سوی دیگر، سازمانهایی مثل سازمان جهانی بهداشت به شناسایی پستهای خطرناک در این شبکه اجتماعی کمک میکنند.

اما آیا هوش مصنوعی هم در این موضوع مفید است؟ جواب واضحی برای این پرسش وجود ندارد، اما مدودف میگوید این شرکت در حال کار روی آن است. او اظهار دارد: «ما مشغول تمرین مدلهای هوش مصنوعی برای شناسایی فعالانه اطلاعات غلط در زمینه واکسیناسیون و انجام اقدامات خودکار در این باره هستیم.»
اینستاگرام در بخش دوم این پست میگوید بهترین روش برای تغییر وضعیت محتواهای زبانه Explore به محتواهایی که خواهان آن هستید این است که با محتواهای مورد علاقه خود تعامل بیشتری داشته باشد. اگر نمیخواهید محتواهای خاصی را ببینید، میتوانید از ابزار See fewer posts like this که در منوی گوشه سمت راست هر پست وجود دارد کمک بگیرید. این ابزار به الگوریتم اینستاگرام اطلاع میدهد که چه تغییراتی باید انجام شود.