هدفونی با قابلیت تشخیص حالات چهره کاربر

# ۴۱۳۴ - ۱۴۰۱/۰۵/۰۴

محققان دانشگاه کرنل آمریکا با کمک فناوری سونار هدفونی با قابلیت تشخیص حالات چهره کاربر ساخته اند. این هدفون می‌تواند به تشخیص خود، یک آواتار از چهره کاربر ایجاد کند. سیستم سونار یا فاصله یاب صوتی نوعی فناوری ردیاب زیر دریایی است که از طریق انتشار امواج صوتی کار می کند.

محققان دانشگاه کرنل (Cornell) آمریکا، یک هدفون ابداع کرده‌اند که از فناوری سونار برای تشخیص حالت چهره کاربر استفاده می‌کند تا یک تمثیل(آواتار) از چهره او ایجاد کند. این سیستم EarIO نامیده می‌شود.

سونار (sonar) یا ناوبری و فاصله‌یابی صوتی، فناوری ردیاب زیردریایی است که از انتشار امواج صوتی استفاده میکند. این روش علاوه بر ردیابی، معمولاً به منظور ناوبری و ارتباط با دیگر یگان‌های شناور و زیرآبی نیز استفاده می‌شود.

خفاش‌ها به منظور حرکت کردن و تعیین مسیر و شکار حشرات به ‌عنوان غذا در تاریکی مطلق، یک سامانه با قدمت بیش از ۶۰ میلیون ساله دارند که بر هر سیستم ناوبری که تاکنون به وسیله فناوری تولید شده، برتری دارد. آنها با فریاد زدن در فرکانس‌های فراصوت (معمولاً بالای ۲۰ کیلوهرتز) می‌توانند صداهای منعکس‌ شده از اشیای اطرافشان را تشخیص دهند و آنها را به صورت «تصویر صوتی» تفسیر کنند. این موضوع بسیار پیچیده‌ای است که آنها می‌توانند در سرعت‌های بالا پرواز کنند و در مسیرشان از همه موانع اجتناب کنند و حتی می‌توانند حشرات کوچک را از فاصله چند متری تشخیص دهند.

بانگ‌ها و صداهای مافوق صوتی که در حنجره خفاش‌ها تولید می‌شود، برای محیط اطرافشان مناسب است و برای پیدا کردن غذا کارآمد و دقیق است. این بدان معنی است که انواع مختلفی از مکان‌یابی‌ها را با استفاده از انعکس صداها مطابق با مقتضیات زیستگاه‌های متفاوتی که دارند، انجام دهند. مکان‌یابی با استفاده از انعکاس صدا عبارت از یک سیستم حسی در جانوران مشخصی مثل خفاش‌ها و دلفین‌ها است. براساس این سیستم آنها معمولاً صداهایی از خودشان خارج می‌کنند و و انعکاس این صداها را برای تعیین مسیر و فاصله اشیا تفسیر می‌کنند.

اکنون این فناوری به شکل انتشار امواج فراصوت از گوش کاربر به سمت گونه‌های او در این هدفون استفاده شده است. بدین ترتیب، صدا از بلندگوهای هر طرف گوشی پخش می‌شود، سپس یک میکروفن، پژواک‌هایی را که با حرکت چهره و صحبت کاربر تغییر می‌کند، می‌گیرد. سپس سیستم از یک الگوریتم یادگیری عمیق استفاده می‌کند تا آن پژواک‌ها را به یک نسخه از حالت چهره کاربر تبدیل کند.

سیستم EarIO می‌تواند حرکات شبیه‌سازی شده صورت را در لحظه به یک دستگاه تلفن همراه منتقل کند و از آواتار ساخته شده توسط این سیستم می‌توان در تماس‌های ویدیویی استفاده کرد.

چنگ ژانگ، محقق اصلی آزمایشگاه رابط‌های رایانه‌ای هوشمند برای تعاملات آینده گفت: دستگاه‌های مبتنی بر دوربین که حرکات صورت را ردیابی می‌کنند، بزرگ، سنگین و پرمصرف هستند که اینها یک مشکل بزرگ برای تعبیه روی ابزارهای پوشیدنی است. وی افزود: همچنین آنها اطلاعات خصوصی زیادی را ضبط می‌کنند. بنابراین یک رویکرد مبتنی بر سونار می‌تواند حریم خصوصی، مقرون به صرفه بودن، راحتی و عمر باتری را تقویت کند.

تیم سازنده در آزمایش اولیه دریافت که این دستگاه در حالی که کاربران نشسته‌اند یا راه می‌روند، به خوبی کار می‌کند و عواملی مانند صداهای دیگر در پس‌زمینه، صدای باد و صدای محیط روی این سیگنال‌های صوتی تاثیری ندارند.

با این حال، حساسیت و دقت بالای روش سنجش این سیستم می‌تواند باعث ایجاد برخی مشکلات نیز بشود. "رویدونگ ژانگ" دانشجوی دکترای علوم اطلاعات و یکی از محققان این پروژه گفت: این سیستم خوب است، زیرا می‌تواند حرکات بسیار ظریف را ردیابی کند، اما در عین حال بد هم هست، چرا که وقتی چیزی در محیط تغییر می‌کند یا وقتی سر شما کمی حرکت می‌کند، ما آن را نیز ثبت می‌کنیم و امیدواریم که در مدل‌های آینده چنین اختلالاتی را کاهش دهیم.

همانطور که گفته شد، سیستم EarIO محدودیت‌هایی نیز دارد. این دستگاه با یک بار شارژ، حدود سه ساعت کار می‌کند که باید در نسخه‌های بعدی بیشتر شود. محققان امیدوارند در آینده عمر باتری این سیستم را بهبود بخشند. آنها همچنین قصد دارند EarIO را به یک دستگاه قابل استفاده‌ی آنی تبدیل کنند، اما در حال حاضر به 32 دقیقه آموزش و دریافت داده‌های صورت قبل از اولین استفاده نیاز دارد.

گروه صنعتی دنا

هدفونی با قابلیت تشخیص حالات چهره کاربر