روشی جدید برای جستجوی اشیا در اینترنت
تشخیص تصاویر و دید کامپیوتر یا computer vision، قابلیتی است که شما میتوانید از هر چیزی یک تصویر به کامپیوتر نشان دهید و کامپیوتر به شما بگوید که چه میبیند.به گزارش کلیک، در دهه گذشته، به لطف شبکههای یادگیری عمیق جهش عظیمی در فناوریهای مختلف صورت گرفته است. شبکههای یادگیری عمیق، در واقع تقریب محاسباتی از این است که مغز انسان چگونه کار میکند و میتواند اشیا و مردم را براساس نمونههای آموزشی از قبل مشاهده شده شناسایی کند. در واقع ابتدا سیستم یاد میگیرد و بعد میتواند به سوالات پاسخ بدهد.

به گزارش کلیک، در دهه گذشته، به لطف شبکههای یادگیری عمیق جهش عظیمی در فناوریهای مختلف صورت گرفته است. شبکههای یادگیری عمیق، در واقع تقریب محاسباتی از این است که مغز انسان چگونه کار میکند و میتواند اشیا و مردم را براساس نمونههای آموزشی از قبل مشاهده شده شناسایی کند. در واقع ابتدا سیستم یاد میگیرد و بعد میتواند به سوالات پاسخ بدهد.
تعدادی از شرکتها در تلاش هستند که از این تکنولوژی در طراحی اشیا استفاده کنند، ولی تاکنون هیچکدام واقعا موفق نبودهاند. با استفاده از اسکن کد QR در یک مغازه، یا نام یک کتاب در سایت آمازون میتوانیم به اینگونه درخواستها برسیم، ولی فناوری هنوز به ما این امکان را نداده است که یک عکس از یک صندلی بگیریم و بتوانیم به راحتی آن یا مشابه با آن صندلی را به صورت آنلاین جستجو کنیم.
این قابلیت جذاب کامپیوترها، اخیرا مورد توجه محققان قرار گرفته است. برای حل این مساله، یک تیم از محققان دانشگاه کرنل در تلاش هستند. یک استارتاپ جدید به نام GrokStyle راهاندازی شده است و دانشمندان کامپیوتر گرد هم آمدهاند تا بتوانند الگوریتمی طراحی کنند که قابلیت شناخت اشیا در یک تصویر را داشته باشد و سپس آن را به کالای دنیای واقعی لینک بدهند و کالا را بفروش برسانند.
آنچه به دنبال آن هستند مشابه تجربه جستجوی پستهای متنی بر روی اینترنت است. همچنین، محققان قصد دارند که علاوه بر اینکه اشیا را تشخیص بدهند، بتوانند بفهمند چه شخص دیگری آن شی را خریداری کرده است و همچنین آیا اشیا مشابه دیگری وجود دارد؟ یا مثلا از چه جنس چوبی در آن استفاده شده است. اما در گام اول، هدف این است که الگوریتمی طراحی شود که بگوید آن شی چیست؟! و بعد تجربه مردم در خرید آن شی را کشف کنند. همانطور که تصور میشود، این کار راحتی نیست و چیزی فراتر از تشخیص گفتار، جلد کتاب و فیلمها است.
ممکن است در رستوران نشسته باشید و یک لوستر را ببینید که از آن خوشتان آمده است. بخواهید یکی مشابه آن را خریداری کنید. همچنین میخواهید بدانید در چه رنگها و چه قیمتهایی در دسترس است. این ایده که از آن عکس بگیرید و براساس تصویر به جستجوی آن بپردازید جالب است. سپس براساس تصویر لیستی از قیمتها از اقلام مشابه نیز دریافت کنید. بعد میتوانید براساس مکان، مواد یا معیارهای خاصی آن را فیلتر کنید. البته صحبت بر سر این که چیزی که میخواهیم کجاست نیست، صحبت بر سر انتخابهای بیشتر است.
در ایدهپردازی کمی جلوتر برویم، حتی کاربر بتواند کیفیت شی چقدر است؟ مثلا اینکه از چه چوب یا پارچهای با چه میزان مرغوبیت در آن استفاده شده است، جستجوی خود را انجام دهد.
سیستمی که تیم در حال طراحی آن است، با عنوان یادگیری شباهتهای بصری برای طراحی محصول با استفاده از شبکههای عصبی کانولوشن در مجله ACM Transactions به چاپ رسیده است. محققان امیدوار هستند که بتوانند تا ماههای آینده کار خود را به اتمام برسانند و سیستم به زودی در دسترس کاربران قرار بگیرد.