PlaNet، شبکه‌ی عصبی گوگل برای تشخیص موقعیت مکانی تصاویر

آیا تا به حال نام PlaNet به گوشتان خورده است ؟ آیا پس از دیدن یک تصویر از خود پرسیده اید که این عکس کجا گرفته شده است ؟ پاسخ این پرسش را شبکه‌ی عصبی گوگل برای تشخیص موقعیت مکانی تصاویر، موسوم به PlaNet به ما خواهد داد.این شبکه‌ی عصبی با استفاده از ۱۲۶ میلیون عکس، آموزش دیده تا عملکردی دقیق‌تر از آدمی داشته باشد.درادامه با گجت نیوز همراه باشید تا بیشتر در مورد PlaNet برایتان بگوییم.

منظور از منظره صرفاً تصاویر زیبای طبیعت نیست، موقعیت مکانی چشم‌انداز‌های متنوع و معماری و … هم توسط شبکه‌ی عصبی گوگل با دقت زیادی حدس زده می‌شود. تاکنون روش‌های ماشینی برای شناسایی موقعیت مکانی تصاویر نتیجه‌ی دقیق و خوبی نداشت اما توبیاس ویلند، یکی از محققین گوگل و تیمش شبکه‌ی عصبی جالبی طراحی کرده‌اند که با نگاه کردن به تصاویر، موقعیت جغرافیایی مربوطه را با دقتی بالاتر از انسان تخمین می‌زند.

تقسیم زمین به مناطق بزرگ و کوچک متناسب با تعداد تصاویر

تقسیم زمین به مناطق بزرگ و کوچک متناسب با تعداد تصاویر

این گروه برای آموزش شبکه‌ی عصبی طراحی شده، کره‌ی زمین را به ۲۶۰۰۰ مربع تقسیم کرده‌اند، اما نه قسمت‌هایی برابر، مساحت هر مربع متناسب با تعداد تصاویر مربوط به آن ناحیه‌ی جغرافیایی است. تصاویر مربوط به شهرهای بزرگ بیشتر است، لذا مش ظریف‌تری برای شهرها در نظر گرفته شده و به این ترتیب بدیهی است که برای مناطق بیابانی و قطب‌های شمال و جنوب، مربع‌ها بزرگ‌تر است و البته برای اقیانوس‌ها و قطب‌ها، هیچ مربعی در نظر گرفته نشده است چرا که تعداد تصاویر ناچیز است.

بانک داده‌ی ۱۲۶ میلیونی شامل تصاویری از نقاط مختلف جهان که در دنیای وب موجود است، ایجاد شده و ۹۱ میلیون تصویر برای آموزش شبکه‌ی عصبی PlaNet به کار رفته (دقت کنید که پِلَنِت به معنی سیاره است) و پس از تکمیل یادگیری، ۳۴ میلیون تصویر دیگر برای سنجش دقت و تأیید نتیجه، مورد استفاده قرار گرفته است.

۰

تیم تحقیقاتی گوگل برای آزمایش شبکه‌ی عصبی ایجاد شده، ۲.۳ میلیون تصویر از Flickr جمع‌آوری کرده، تصاویری که همگی موقعیت جغرافیایی را به صورت متادیتا، در خود دارند. PlaNet محل عکاسی حدود ۳.۶ درصد از تصاویر را با دقتی در حد خیابان‌ها، شناسایی کرده، ۱۰.۱ درصد از نظر شهر درست شناسایی شده‌اند، ۲۸.۴ درصد با دقتی در حد کشور و ۴۸ درصد از نظر قارّه درست تشخیص داده شده‌اند.

یک بازی آنلاین، شما هم می‌توانید دقت خود را اندازه بگیرید

شاید اعداد جالب به نظر نرسد اما جالب است بندانید که آدمی دقت به مراتب کمتری دارد. تیم تحقیقاتی گوگل ۱۰ انسان با تجربه‌ی مسافرت‌های طولانی را برای مقایسه دقت انتخاب کرده و یک بازی آنلاین طراحی کرده که موضوع آن تشخیص موقعیت جغرافیایی عکس است. این بازی آنلاین مبتنی بر سرویس استریت ویوی گوگل است، سرویسی که تصاویری از مناطق مختلف جغرافیایی را به صورت پانوراما در اختیار کاربران قرار می‌دهد.

PlaNet در این بازی، اغلب با خطایی کمتر از ۱۱۰۰ کیلومتر، دقت خود را به نمایش گذاشته و در مقابل ۱۰ سیاحت‌گر با تجربه، خطایی در حد ۲۳۰۰ کیلومتر دارند. بنابراین دقت PlaNet حدود دو برابر است.

ویلند معتقد است که سیاحت‌گران در زندگی خود نمی‌توانند به تمام نقاط دنیا سفر کنند اما شبکه‌ی عصبی به راحتی نقاط بیشتری را مشاهده می‌کند. تیم تحقیقاتی گوگل برای تخمین موقعیت جغرافیایی تصاویری که در محیط داخلی گرفته شده‌اند، هم راه حلی ساده دارد: شبکه‌ی عصبی تصاویری که در یک آلبوم قرار گرفته‌اند را به یک موقعیت جغرافیایی مربوط می‌کند، به این ترتیب اگر سایر عکس‌های آلبوم به یک موقعیت خاص مربوط باشد، احتمالاً عکس‌هایی محیط داخلی هم به همان منطقه مربوط است.

۳۷۷ مگابایت، نتیجه‌ی آموزش شبکه‌ی عصبی PlaNet

اما به نتیجه‌ی تمام تحقیقات می‌رسیم: آیا این شبکه‌ی عصبی صرفاً برای گوگل مفید است یا از نظر حجم داده، در حدی است که وسایل مختلف می‌توانند از آن بهره‌مند شوند؟ حجم مدلی که شبکه‌ی عصبی بر اساس آن در مورد موقعیت جغرافیایی عکس‌ها قضاوت می‌کند، فقط ۳۷۷ مگابایت است! لذا ممکن است در آینده‌ی دور و شاید نزدیک، در محصولات گوگلی به خدمت گرفته شود.

منبع : androidauthority

پاسخ بدهید

وارد کردن نام و ایمیل اجباری است | در سایت ثبت نام کنید یا وارد شوید و بدون وارد کردن مشخصات نظر خود را ثبت کنید *

*