آمازون، هم پای اپل ، مایکروسافت و گوگل، توجه ویژهای به دستیار صوتی خود دارد. الکسا، دستیار صوتی آمازون، قادر است صدا و دستورات کاربر را شنیده و آنها را اجرا نماید. این دستورات، طیف وسیعی از کاربردها را شامل میشود که از آن جمله، میتوان به پخش موسیقی، پاسخ دادن به سؤالات کاربر، تنظیم و یادآوری قرار ملاقات در تقویم و ... اشاره نمود. البته آمازون دائماً در حال تلاش برای بهبود و گسترش قابلیتهای این دستیار صوتی خود بوده و اختراعاتی را نیز در همین زمینه به ثبت رسانده است. در ماه اکتبر سال گذشته میلادی، این شرکت، موفق به اخذ گواهی ثبت اختراعی شده بود که به الکسا، امکان میداد تا از طریق شناسایی تغییرات در صدای کاربر، قابلیت تشخیص بیماری در وی را فراهم نموده و علاوه بر این، قادر به شناسایی حالات احساسی کاربر، مانند شادی، غم، خشم، خستگی، ترس، خوابآلودگی و گریه نیز بود. پیش از آن نیز، آمازون پتنتی را به ثبت رسانیده بود که بر اساس آن، دستگاه به مکالمات کاربر گوش داده و با رصد علایق او، کالا یا خدمات مرتبطی را به وی پیشنهاد میداد.
درخواستهای جدید ثبت اختراع آمازون، نشان میدهد که با وجود فعالیتهای گستردهای که این شرکت در خصوص ارتقای الکسا انجام داده است، همچنان دست از تلاش برای دستیابی به دستاوردهای جدید، بر نداشته است. در همین راستا، اداره ثبت اختراعات و علائم تجاری آمریکا «USPTO»، در تاریخ دهم ژانویه سال جاری میلادی، پتنت جدیدی به شماره «US20190013033»، منتشر نموده که بهبود امنیت الکسا را دنبال مینماید. فناوری جدید ارائه شده توسط آمازون، حاکی از آن است که این شرکت، راهی برای مقابله با حملات بازپخش در سیستمهای احراز هویت صوتی، پیدا نموده است. حمله بازپخش یا «playback attack» یا «replay attack»، نوعی حمله تحت شبکه است که در آن، انتقال دادههای معتبر، با انگیزههایی سوء، مانند کلاهبرداری، تکرار شده و یا با تأخیر، همراه میشوند.
در این فناوری جدید، پس از ورود صوت، از طریق ورودی صوتی دستگاه، بررسیهای لازم بر روی آن انجام میشود، تا اطمینان حاصل گردد که آیا متعلق به کاربر هست یا خیر. به این منظور، یک فرایند چند مرحلهای تعبیه شده است؛ در مرحله اول، بررسی شده که آیا صوت ورودی، دارای یک عامل تأییدکننده هویت صدا هست یا خیر. سپس در مرحله دوم، صوت دریافت شده، با اصوات ذخیره شده کاربر، مقایسه گردیده و اگر از این مرحله هم با موفقیت عبور نماید، بررسی میشود که آیا یک کپی دقیق از فاکتور تأیید هویت صوتی، در صداهای ذخیره شده کاربر وجود دارد یا خیر.»
گفتنی است، به نظر میرسد که آمازون، محافظتهای جدید خود را بر روی چیزی به نام «سیگنال واترمارک» که یک کپی دیجیتال از فرمان است، پایهگذاری نموده است. بر این اساس، مثلاً هنگامی که دستگاه، فرمان «در گاوصندوق را باز کن» را میشنود، میتواند تشخیص دهد که چنین دستوری قبلاً صادر شده یا خیر و اگر تشخیص دهد که فرمان صوتی، یک صدای ضبط شده است، چنین فرمانی را اطاعت نمیکند.