افزایش امنیت دستیار صوتی آمازون
۱۴ بهمن ۱۳۹۷ افزایش امنیت دستیار صوتی آمازون

آمازون، هم پای اپل ، مایکروسافت و گوگل، توجه ویژه‌ای به دستیار صوتی خود دارد. الکسا، دستیار صوتی آمازون، قادر است صدا و دستورات کاربر را شنیده و آن‌ها را اجرا نماید. این دستورات، طیف وسیعی از کاربردها را شامل می‌شود که از آن جمله، می‌توان به پخش موسیقی، پاسخ دادن به سؤالات کاربر، تنظیم و یادآوری قرار ملاقات در تقویم و ... اشاره نمود. البته آمازون دائماً در حال تلاش برای بهبود و گسترش قابلیت‌های این دستیار صوتی خود بوده و اختراعاتی را نیز در همین زمینه به ثبت رسانده است. در ماه اکتبر سال گذشته میلادی، این شرکت، موفق به اخذ گواهی ثبت اختراعی شده بود که به الکسا، امکان می‌داد تا از طریق شناسایی تغییرات در صدای کاربر، قابلیت تشخیص بیماری در وی را فراهم نموده و علاوه بر این، قادر به شناسایی حالات احساسی کاربر، مانند شادی، غم، خشم، خستگی، ترس، خواب‌آلودگی و گریه نیز بود. پیش از آن نیز، آمازون پتنتی را به ثبت رسانیده بود که بر اساس آن، دستگاه به مکالمات کاربر گوش داده و با رصد علایق او، کالا یا خدمات مرتبطی را به وی پیشنهاد می‌داد.

درخواست‌های جدید ثبت اختراع آمازون، نشان می‌دهد که با وجود فعالیت‌های گسترده‌ای که این شرکت در خصوص ارتقای الکسا انجام داده است، همچنان دست از تلاش برای دستیابی به دستاوردهای جدید، بر نداشته است. در همین راستا، اداره ثبت اختراعات و علائم تجاری آمریکا «USPTO»، در تاریخ دهم ژانویه سال جاری میلادی، پتنت جدیدی به شماره «US20190013033»، منتشر نموده که بهبود امنیت الکسا را دنبال می‌نماید. فناوری جدید ارائه شده توسط آمازون، حاکی از آن است که این شرکت، راهی برای مقابله با حملات بازپخش در سیستم‌های احراز هویت صوتی، پیدا نموده است. حمله بازپخش یا «playback attack» یا «replay attack»، نوعی حمله تحت شبکه است که در آن، انتقال داده‌های معتبر، با انگیزه‌هایی سوء، مانند کلاهبرداری، تکرار شده و یا با تأخیر، همراه می‌شوند.

در این فناوری جدید، پس از ورود صوت، از طریق ورودی صوتی دستگاه، بررسی‌های لازم بر روی آن انجام می‌شود، تا اطمینان حاصل گردد که آیا متعلق به کاربر هست یا خیر. به این منظور، یک فرایند چند مرحله‌ای تعبیه شده است؛ در مرحله اول، بررسی شده که آیا صوت ورودی، دارای یک عامل تأییدکننده هویت صدا هست یا خیر. سپس در مرحله دوم، صوت دریافت شده، با اصوات ذخیره شده کاربر، مقایسه گردیده و اگر از این مرحله هم با موفقیت عبور نماید، بررسی می‌شود که آیا یک کپی دقیق از فاکتور تأیید هویت صوتی، در صداهای ذخیره شده کاربر وجود دارد یا خیر.»

گفتنی است، به نظر می‌رسد که آمازون، محافظت‌های جدید خود را بر روی چیزی به نام «سیگنال واترمارک» که یک کپی دیجیتال از فرمان است، پایه‌گذاری نموده است. بر این اساس، مثلاً هنگامی که دستگاه، فرمان «در گاوصندوق را باز کن» را می‌شنود، می‌تواند تشخیص دهد که چنین دستوری قبلاً صادر شده یا خیر و اگر تشخیص دهد که فرمان صوتی، یک صدای ضبط شده است، چنین فرمانی را اطاعت نمی‌کند.