هر از چند گاهي شاهد دستاوردهاي بزرگي از آزمايشگاههاي گوگل هستيم. گوگل برخلاف بسياري از شرکتها که همه تلاش خود را معطوف به فروش و توليد محصولات جديد کردهاند، نوآوريهاي خلاقانه و کاربردي نظير ماشين بدون راننده، عينک گوگل و حالا پروژه عظيم قدرت بينايي بخشيدن به ماشين را به پيش ميبرد. گوگل در تلاش است تا به کامپيوتر بياموزد که چگونه چهره انسان را از ديگر موجودات زنده تشخيص دهد. اين پروژه پيچيده به غول جستجوي جهان کمک ميکند تا گامهاي بزرگي را در زمينه يادگيري ماشين بردارد و بدين ترتيب بينايي را به کامپيوترهاي آينده هديه کند.
مقاله تحقيقاتي گوگل قرار است براي کنفرانس International Machine Learning آماده شود. در اين مقاله گوگل چگونگي تشخيص چهره انسان با 15.8 درصد صحت با استفاده از 1,000 کامپيوتر و 16,000 هسته پردازشي، شرح داده است.
هر چند صحت سيستم قابل ملاحظه و تأثيرگذار نيست ( قابليت تشخيص 4 چهره از 25 چهره) اما اين روش نسبت به گذشته 70 درصد پيشرفت و بهبود داشته است.
اگر هزاران عکس به اين سيستم گوگل داده شود، ابتدا عکسهاي حاوي چهره را از ديگر عکسها جدا ميکند سپس تشخيص ميدهد که چهرههاي موجود متعلق به کدام دسته انسان يا حيوان هستند و سپس آنها را دستهبندي ميکند. البته اگر از سيستمهاي يادگيري رايج و عکسهاي برچسبدار استفاده شود، صحت سيستم بالا ميرود ولي اين مدل سيستم به يادگيري طولاني مدت و پرهزينه نياز دارد. روش گوگل بر اين اساس است که از دادههاي بدون برچسب استفاده کند و همچنين در کنار آن از روشها متفاوت پردازشي به منظور يادگيري و آموزش سيستم بهره ببرد تا از اين طريق زمان آموزش يک هفتهاي سيستم را به سه روز تقليل دهد.
گوگل در مقاله خود بدين صورت نوشته است که اگر ماشينها اين نحوه آموزش و تشخيص را به خوبي ياد بگيرند بدين معنا است که آنها در حقيقت مثل انسانها فرايند يادگيري را طي کردهاند.
اين مطالعه به بررسي امکان بهکارگيري ويژگيهاي سطح بالا از دادههاي بدون پرچسب ميپردازد. اگر اين مطالعه با موفقيتهاي بيشتري همراه باشد، دو نتيجه مهم علمي را در برخواهد داشت. در زمينههاي عملياتي، نتايج مثبت اين آزمايش ميتواند منجر به توسعه ويژگيهايي بر روي دادههاي بدون برچسب شود که از نظر هزينه بسيار مقرون به صرفه خواهد بود. در حقيقت اين پروژه نشان ميدهد که لااقل در اصل امکان پذير است که يک کودک به دليل مواجهه بصري و ديداري با تعداد زيادي چهره ميتواند چهرهها را به گروه مشخصي نسبت دهد و آنها را طبقهبندي کند بدون آنکه توسط راهنمايي در اين زمينه آموزش ببيند يا هدايت شود.
تحقيق و پژوهش در اصل و ريشه زبانها و اينکه چگونه انسانها ياد ميگيرند تا اشياء مختلف را از هم تشخيص داده و آنها را در ذهن دستهبندي کنند، هنوز ادامه دارد و نتايج راهي که گوگل در آن پاي نهاده است ميتواند به بسياري از دانشمندان و محققان انسانشناسي در پيدا کردن جوابهاي خود کمک شاياني کند. و از بعد عملي نيز استفاده از تجهيزات زياد کامپيوتري براي اعطاي بينايي به ماشينها ميتواند دروازه بزرگي به سوي تکنيکهاي آموزش آينده باشد.
کامپيوترهايي که ميبينند، کامپيوترهايي که ياد ميگيرند
محصولات پيشرفته جهان امروز مثل کينکت مايکروسافت يا عينک گوگل، گجتهايي هستند که دنياي کامپيوتر را با دنياي پيچيده بشر در هم آميختهاند. هم اکنون بسيار محتمل است که به ماشينها بياموزيم تا حرکات متفاوت را بر اساس برنامهاي که براي آنها نوشته شده است شناسايي کنند و حتي عکسالعملهاي برنامهريزي شدهاي را از خود نشان دهند. هر چند که تعدادي از محصولات لمسي قادرند به کمک دوربين خود اعمال و حرکات متفاوت را از هم تميز دهند ولي اينکه کامپيوتري بخواهد به معناي واقعي ببيند امر بسيار پيچيدهاي است.
انسان زماني که ميبيند هم از چشم خود استفاده ميکند و هم از مغزش. چشمان ما همانند سنسورهايي ميباشند که اطلاعات روشنايي، تاريکي و رنگها را براي تفسير در اختيار مغز قرار ميدهند.
کامپيوتر از دوربين و انواع و اقسام سنسورها که همانند چشم عمل ميکنند بهره ميبرد. براي آموزش يک کامپيوتر براي ديدن، برنامهنويسان بايد ماشين را آموزش دهند و به او بياموزند که در مواقع مختلف و در هنگام مواجهه با سناريوهاي گوناگون چگونه عمل کند. گوگل در حقيقت به دنبال راهي است تا از طريق به کارگيري تعداد زيادي ماشين محاسباتي و کم کردن ويژگيهاي مربوط به عکسهايي که بايد به ماشين نشان داد، زمان مورد نياز براي آموزش را کاهش دهد. بنابراين کامپيوتر اگر تعداد مناسبي از عکسها را ببيند و قدرت پردازشي کافي را در اين زمينه داشته باشد ميتواند اهداف گوگل را محقق کند.
محققان گوگل ميگويند که شبکه کامپيوتري و عصبي آنها يکي از بزرگترين شبکهکامپيوتري تحقيقاتي دنيا است. شبکه گوگل بالغ بر يک ميليارد پارامتر براي آموزش دارد که از ديگر شبکهها چندي برابر بزرگتر است. با اين حال شبکه گوگل نسبت به قشر بينايي مغز انسان از نظر تعداد نورونها و سيناپسها ميليونها برابر کوچکتر است.
آموزش کامپيوتر براي ديدن، يک دستاورد فوق العاده عظيم است. تصور کنيد که گوشي هوشمند شما بتواند اشيا را ببيند و سپس آنها را دستهبندي کند! اگر گوشي شما به گنجينه غني از اطلاعات هم دسترسي داشته باشد ميتواند براي هر دسته مثل، ساختمان، اثر هنري و حتي يک غذا، اطلاعات زيادي را در اختيار شما قرار دهد. هم اکنون مجبوريم دادههاي اوليه را بعضا با صفحه کليد کوچک گوشي هوشمند خود وارد کنيم تا به اطلاعات جانبي دست پيدا کنيم يا اينکه عکس گرفته و آن را در اختيار ديتابيس خام و غير قابل اطمينان تشخيص تصاوير قرار دهيم مانند آنچه Google Goggles انجام ميدهد.
البته نگرانيهاي جدي هم در مورد حريم خصوصي افراد و اينکه دولتها بخواهند در پشت اين ابزارهاي محاسباتي به نظارت خود بپردازند هم وجود دارد.
بيشک در سالهاي آينده صحت سيستم گوگل به مراتب بالاتر خواهد رفت و بدين ترتيب بايد شاهد آن باشيم که ماشينها هر چه بيشتر و بيشتر به ما انسانها نزديک شده و بدين ترتيب هوش مصنوعي در اداره جهان نقش انکارناپذيري خواهد داشت.
منبع : Gigaom