آیا تا به حال نام PlaNet به گوشتان خورده است ؟ آیا پس از دیدن یک تصویر از خود پرسیده اید که این عکس کجا گرفته شده است ؟ پاسخ این پرسش را شبکهی عصبی گوگل برای تشخیص موقعیت مکانی تصاویر، موسوم به PlaNet به ما خواهد داد.این شبکهی عصبی با استفاده از ۱۲۶ میلیون عکس، آموزش دیده تا عملکردی دقیقتر از آدمی داشته باشد.درادامه با گجت نیوز همراه باشید تا بیشتر در مورد PlaNet برایتان بگوییم.
منظور از منظره صرفاً تصاویر زیبای طبیعت نیست، موقعیت مکانی چشماندازهای متنوع و معماری و … هم توسط شبکهی عصبی گوگل با دقت زیادی حدس زده میشود. تاکنون روشهای ماشینی برای شناسایی موقعیت مکانی تصاویر نتیجهی دقیق و خوبی نداشت اما توبیاس ویلند، یکی از محققین گوگل و تیمش شبکهی عصبی جالبی طراحی کردهاند که با نگاه کردن به تصاویر، موقعیت جغرافیایی مربوطه را با دقتی بالاتر از انسان تخمین میزند.
این گروه برای آموزش شبکهی عصبی طراحی شده، کرهی زمین را به ۲۶۰۰۰ مربع تقسیم کردهاند، اما نه قسمتهایی برابر، مساحت هر مربع متناسب با تعداد تصاویر مربوط به آن ناحیهی جغرافیایی است. تصاویر مربوط به شهرهای بزرگ بیشتر است، لذا مش ظریفتری برای شهرها در نظر گرفته شده و به این ترتیب بدیهی است که برای مناطق بیابانی و قطبهای شمال و جنوب، مربعها بزرگتر است و البته برای اقیانوسها و قطبها، هیچ مربعی در نظر گرفته نشده است چرا که تعداد تصاویر ناچیز است.
بانک دادهی ۱۲۶ میلیونی شامل تصاویری از نقاط مختلف جهان که در دنیای وب موجود است، ایجاد شده و ۹۱ میلیون تصویر برای آموزش شبکهی عصبی PlaNet به کار رفته (دقت کنید که پِلَنِت به معنی سیاره است) و پس از تکمیل یادگیری، ۳۴ میلیون تصویر دیگر برای سنجش دقت و تأیید نتیجه، مورد استفاده قرار گرفته است.
تیم تحقیقاتی گوگل برای آزمایش شبکهی عصبی ایجاد شده، ۲.۳ میلیون تصویر از Flickr جمعآوری کرده، تصاویری که همگی موقعیت جغرافیایی را به صورت متادیتا، در خود دارند. PlaNet محل عکاسی حدود ۳.۶ درصد از تصاویر را با دقتی در حد خیابانها، شناسایی کرده، ۱۰.۱ درصد از نظر شهر درست شناسایی شدهاند، ۲۸.۴ درصد با دقتی در حد کشور و ۴۸ درصد از نظر قارّه درست تشخیص داده شدهاند.
شاید اعداد جالب به نظر نرسد اما جالب است بندانید که آدمی دقت به مراتب کمتری دارد. تیم تحقیقاتی گوگل ۱۰ انسان با تجربهی مسافرتهای طولانی را برای مقایسه دقت انتخاب کرده و یک بازی آنلاین طراحی کرده که موضوع آن تشخیص موقعیت جغرافیایی عکس است. این بازی آنلاین مبتنی بر سرویس استریت ویوی گوگل است، سرویسی که تصاویری از مناطق مختلف جغرافیایی را به صورت پانوراما در اختیار کاربران قرار میدهد.
PlaNet در این بازی، اغلب با خطایی کمتر از ۱۱۰۰ کیلومتر، دقت خود را به نمایش گذاشته و در مقابل ۱۰ سیاحتگر با تجربه، خطایی در حد ۲۳۰۰ کیلومتر دارند. بنابراین دقت PlaNet حدود دو برابر است.
ویلند معتقد است که سیاحتگران در زندگی خود نمیتوانند به تمام نقاط دنیا سفر کنند اما شبکهی عصبی به راحتی نقاط بیشتری را مشاهده میکند. تیم تحقیقاتی گوگل برای تخمین موقعیت جغرافیایی تصاویری که در محیط داخلی گرفته شدهاند، هم راه حلی ساده دارد: شبکهی عصبی تصاویری که در یک آلبوم قرار گرفتهاند را به یک موقعیت جغرافیایی مربوط میکند، به این ترتیب اگر سایر عکسهای آلبوم به یک موقعیت خاص مربوط باشد، احتمالاً عکسهایی محیط داخلی هم به همان منطقه مربوط است.
اما به نتیجهی تمام تحقیقات میرسیم: آیا این شبکهی عصبی صرفاً برای گوگل مفید است یا از نظر حجم داده، در حدی است که وسایل مختلف میتوانند از آن بهرهمند شوند؟ حجم مدلی که شبکهی عصبی بر اساس آن در مورد موقعیت جغرافیایی عکسها قضاوت میکند، فقط ۳۷۷ مگابایت است! لذا ممکن است در آیندهی دور و شاید نزدیک، در محصولات گوگلی به خدمت گرفته شود.
منبع : androidauthority