فیس بوک می خواهد ماشین ها دنیا را از چشم ما ببینند

[ad_1]

در دو سال گذشته ، Facebook AI Research (FAIR) با 13 دانشگاه در سراسر جهان همکاری کرده است تا بزرگترین مجموعه داده های ویدئوهای اول شخص را تا به امروز جمع آوری کند – به طور خاص برای آموزش مدل های تشخیص تصویر با یادگیری عمیق. هوش مصنوعی که با مجموعه داده آموزش دیده است می تواند روبات هایی را که با انسان ها تعامل دارند یا تصاویر را از عینک های هوشمند تفسیر می کنند بهتر کنترل کند. کریستن گرومن از FAIR ، سرپرست این پروژه می گوید: “ماشین ها تنها در صورتی می توانند به ما در زندگی روزمره کمک کنند که جهان را از طریق چشم ما درک کنند.”

چنین فناوری هایی می تواند از افرادی که در خانه نیاز به کمک دارند پشتیبانی کند یا افرادی را که وظایفی را که یاد می گیرند انجام دهند راهنمایی کند. مایکل ریو ، محقق بینایی رایانه ای در Google Brain و دانشگاه استونی بروک در نیویورک که در Ego4D مشارکت ندارد ، می گوید: “فیلم موجود در این مجموعه داده به نحوه تماشای جهان بسیار نزدیکتر است.”

اما سوء استفاده احتمالی روشن و نگران کننده است. این تحقیق توسط فیس بوک تأمین می شود ، غول رسانه های اجتماعی که اخیراً در مجلس سنای آمریکا متهم شده است که سود را بالاتر از رفاه مردم قرار می دهد – همانطور که توسط تحقیقات MIT Technology Review تأیید شده است.

مدل کسب و کار فیس بوک و دیگر شرکت های بزرگ فناوری این است که تا آنجا که ممکن است داده ها را از رفتار آنلاین افراد استخراج کرده و به تبلیغ کنندگان بفروشند. هوش مصنوعی که در پروژه بیان شده است می تواند این محدوده را به رفتارهای آفلاین روزمره افراد گسترش دهد و نشان دهد که در خانه شما چه اشیایی وجود دارد ، از چه فعالیتهایی لذت برده اید ، با چه کسانی وقت گذرانده اید و حتی در کجا نگاه می کنید – یک سطح بی سابقه شخصی اطلاعات

گرومن می گوید: “اگر این کار را از دنیای تحقیقات اکتشافی خارج کرده و به یک محصول تبدیل کنید ، هنوز هم باید در زمینه حفاظت از داده ها کار کرد.” “این اثر حتی می تواند از این پروژه الهام گرفته شود.”

فیس بوک

بزرگترین رکورد ویدئوهای ego تا به امروز شامل 100 ساعت فیلم افراد در آشپزخانه است. مجموعه داده Ego4D شامل 3025 ساعت فیلمبرداری است که توسط 855 نفر در 73 مکان مختلف در نه کشور (ایالات متحده ، انگلستان ، هند ، ژاپن ، ایتالیا ، سنگاپور ، عربستان سعودی ، کلمبیا و رواندا) ضبط شده است.

شرکت کنندگان گروه های سنی مختلف و زمینه های مختلف داشتند. برخی در حرفه های بصری جالب خود مانند نانوایان ، مکانیک ، نجار و غرفه داران زمین جذب شدند.

مجموعه داده های قبلی به طور معمول شامل کلیپ های ویدئویی نیمه اسکریپت شده تنها چند ثانیه بود. در Ego4D ، شرکت کنندگان هر کدام تا 10 ساعت از دوربین های سر استفاده می کردند و فیلم های اول شخص از فعالیت های روزانه غیرقابل تجربی ، از جمله قدم زدن در خیابان ، خواندن ، شستن لباس ها ، خرید ، بازی با حیوانات خانگی ، بازی های روی میز و تعامل را ضبط می کردند. با دیگران مردم برخی از ضبط ها همچنین شامل صدا ، داده های مربوط به محل نگاه شرکت کنندگان و دیدگاه های متعدد در یک صحنه است. ریو می گوید این اولین مجموعه داده در نوع خود است.

[ad_2]

Emerson Brooks

گورو تلویزیون. حل کننده مشکل علاقه مندان به وب. ماون مسافرتی بی عذرخواهی تنظیم کننده.

تماس با ما