Google I/O : تلاش گوگل براي بينايي بخشيدن به کامپيوتر

هر از چند گاهي شاهد دستاوردهاي بزرگي از آزمايشگاه‌هاي گوگل هستيم. گوگل برخلاف بسياري از شرکت‌ها که همه تلاش خود را معطوف به فروش و توليد محصولات جديد کرده‌اند، نوآوري‌هاي خلاقانه و کاربردي نظير ماشين بدون راننده، عينک گوگل و حالا پروژه عظيم قدرت بينايي بخشيدن به ماشين را به پيش مي‌برد. گوگل در تلاش است تا به کامپيوتر بياموزد که چگونه چهره انسان را از ديگر موجودات زنده تشخيص دهد. اين پروژه پيچيده به غول جستجوي جهان کمک مي‌کند تا گام‌هاي بزرگي را در زمينه يادگيري ماشين بردارد و بدين ترتيب بينايي را به کامپيوترهاي آينده هديه کند.

مقاله تحقيقاتي گوگل قرار است براي کنفرانس International Machine Learning آماده شود. در اين مقاله گوگل چگونگي تشخيص چهره انسان با 15.8 درصد صحت با استفاده از 1,000 کامپيوتر و 16,000 هسته پردازشي، شرح داده است.

هر چند صحت سيستم قابل ملاحظه و تأثيرگذار نيست ( قابليت تشخيص 4 چهره از 25 چهره) اما اين روش نسبت به گذشته 70 درصد پيشرفت و بهبود داشته است.

اگر هزاران عکس به اين سيستم گوگل داده شود، ابتدا عکس‌هاي حاوي چهره‌ را از ديگر عکس‌ها جدا مي‌کند سپس تشخيص مي‌دهد که چهره‌هاي موجود متعلق به کدام دسته انسان يا حيوان هستند و سپس آن‌ها را دسته‌بندي مي‌کند. البته اگر از سيستم‌‌هاي يادگيري رايج و عکس‌هاي برچسب‌دار استفاده شود، صحت سيستم بالا مي‌رود ولي اين مدل سيستم به يادگيري طولاني مدت و پرهزينه نياز دارد. روش گوگل بر اين اساس است که از داده‌‌هاي بدون برچسب استفاده کند و همچنين در کنار آن از روش‌ها متفاوت پردازشي به منظور يادگيري و آموزش سيستم بهره ببرد تا از اين طريق زمان آموزش يک هفته‌اي سيستم را به سه روز تقليل دهد.

گوگل در مقاله خود بدين صورت نوشته است که اگر ماشين‌ها اين نحوه آموزش و تشخيص را به خوبي ياد بگيرند بدين معنا است که آن‌ها در حقيقت مثل انسان‌ها فرايند يادگيري را طي کرده‌اند.

اين مطالعه به بررسي امکان به‌کارگيري ويژگي‌هاي سطح بالا از داده‌هاي بدون پرچسب مي‌پردازد. اگر اين مطالعه با موفقيت‌هاي بيشتري همراه باشد، دو نتيجه مهم علمي را در برخواهد داشت. در زمينه‌هاي عملياتي، نتايج مثبت اين آزمايش مي‌تواند منجر به توسعه ويژگي‌هايي بر روي داده‌هاي بدون برچسب شود که از نظر هزينه بسيار مقرون به صرفه خواهد بود. در حقيقت اين پروژه نشان‌ مي‌دهد که لااقل در اصل امکان پذير است که يک کودک به دليل مواجهه بصري و ديداري با تعداد زيادي چهره مي‌تواند چهره‌ها را به گروه مشخصي نسبت دهد و آن‌ها را طبقه‌بندي کند بدون آنکه توسط راهنمايي در اين زمينه آموزش ببيند يا هدايت شود.

تحقيق و پژوهش در اصل و ريشه زبان‌ها و اينکه چگونه انسان‌ها ياد مي‌گيرند تا اشياء مختلف را از هم تشخيص داده و آن‌ها را در ذهن دسته‌بندي کنند، هنوز ادامه دارد و نتايج راهي که گوگل در آن پاي نهاده است مي‌تواند به بسياري از دانشمندان و محققان انسان‌شناسي در پيدا کردن جواب‌هاي خود کمک شاياني کند. و از بعد عملي نيز استفاده از تجهيزات زياد کامپيوتري براي اعطاي بينايي به ماشين‌ها مي‌تواند دروازه بزرگي به سوي تکنيک‌هاي آموزش آينده باشد.

کامپيوترهايي که مي‌بينند، کامپيوترهايي که ياد مي‌گيرند

محصولات پيشرفته جهان امروز مثل کينکت مايکروسافت يا عينک گوگل، گجت‌هايي هستند که دنياي کامپيوتر را با دنياي پيچيده بشر در هم آميخته‌اند. هم اکنون بسيار محتمل است که به ماشين‌ها بياموزيم تا حرکات متفاوت را بر اساس برنامه‌اي که براي آنها نوشته شده است شناسايي کنند و حتي عکس‌العمل‌هاي برنامه‌ريزي شده‌اي را از خود نشان دهند. هر چند که تعدادي از محصولات لمسي قادرند به کمک دوربين خود اعمال و حرکات متفاوت را از هم تميز دهند ولي اينکه کامپيوتري بخواهد به معناي واقعي ببيند امر بسيار پيچيده‌اي است.

انسان زماني که مي‌بيند هم از چشم خود استفاده مي‌کند و هم از مغزش. چشمان ما همانند سنسورهايي مي‌باشند که اطلاعات روشنايي، تاريکي و رنگ‌ها را براي تفسير در اختيار مغز قرار مي‌دهند.

کامپيوتر از دوربين و انواع و اقسام سنسورها که همانند چشم عمل مي‌کنند بهره مي‌برد. براي آموزش يک کامپيوتر براي ديدن، برنامه‌نويسان بايد ماشين را آموزش دهند و به او بياموزند که در مواقع مختلف و در هنگام مواجهه با سناريوهاي گوناگون چگونه عمل کند. گوگل در حقيقت به دنبال راهي است تا از طريق به کارگيري تعداد زيادي ماشين محاسباتي و کم کردن ويژگي‌هاي مربوط به عکس‌هايي که بايد به ماشين نشان داد، زمان مورد نياز براي آموزش را کاهش دهد. بنابراين کامپيوتر اگر تعداد مناسبي از عکس‌ها را ببيند و قدرت پردازشي کافي را در اين زمينه داشته باشد مي‌تواند اهداف گوگل را محقق کند.

محققان گوگل مي‌گويند که شبکه کامپيوتري و عصبي آن‌ها يکي از بزرگترين شبکه‌کامپيوتري تحقيقاتي دنيا است. شبکه گوگل بالغ بر يک ميليارد پارامتر براي آموزش دارد که از ديگر شبکه‌ها چندي برابر بزرگ‌تر است. با اين حال شبکه گوگل نسبت به قشر بينايي مغز انسان از نظر تعداد نورون‌ها و سيناپس‌ها ميليون‌ها برابر کوچک‌تر است.

آموزش کامپيوتر براي ديدن، يک دستاورد فوق العاده عظيم است. تصور کنيد که گوشي هوشمند شما بتواند اشيا را ببيند و سپس آن‌ها را دسته‌بندي کند! اگر گوشي شما به گنجينه غني از اطلاعات هم دسترسي داشته باشد مي‌تواند براي هر دسته مثل، ساختمان، اثر هنري و حتي يک غذا، اطلاعات زيادي را در اختيار شما قرار دهد. هم اکنون مجبوريم داده‌هاي اوليه را بعضا با صفحه کليد کوچک گوشي هوشمند خود وارد کنيم تا به اطلاعات جانبي دست پيدا کنيم يا اينکه عکس گرفته و آن را در اختيار ديتابيس خام و غير قابل اطمينان تشخيص تصاوير قرار دهيم مانند آنچه Google Goggles انجام مي‌دهد.

البته نگراني‌هاي جدي هم در مورد حريم خصوصي افراد و اينکه دولت‌ها بخواهند در پشت اين ابزارهاي محاسباتي به نظارت خود بپردازند هم وجود دارد.

بي‌شک در سال‌هاي آينده صحت سيستم گوگل به مراتب بالاتر خواهد رفت و بدين ترتيب بايد شاهد آن باشيم که ماشين‌ها هر چه بيشتر و بيشتر به ما انسان‌ها نزديک شده و بدين ترتيب هوش مصنوعي در اداره جهان نقش انکارناپذيري خواهد داشت.


منبع : Gigaom

پاسخ بدهید

وارد کردن نام و ایمیل اجباری است | در سایت ثبت نام کنید یا وارد شوید و بدون وارد کردن مشخصات نظر خود را ثبت کنید *

*