Състезанието да скриеш гласа си

Гласът ви разкрива повече за вас, отколкото предполагате. За човешкото ухо гласът ви може моментално да предаде настроението ви, например – лесно е да разберете дали сте развълнувани или разстроени. Но машините могат да научат много повече: да направят извод за вашата възраст, пол, етническа принадлежност, социално-икономически статус, здравословни условия и други. Изследователите дори са успели генериране на изображения на лица въз основа на информацията, съдържаща се в гласовите данни на хората.

Тъй като машините стават по-добри в разбирането ви чрез гласа ви, компаниите печелят. Системите за разпознаване на глас – от Siri и Alexa до тези, които използват гласа ви като парола – се размножиха през последните години, тъй като изкуственият интелект и машинното обучение отключиха способността да разбирате не само какво казвате, но и кой сте. Големият глас може да е а 20 милиарда долара индустрия в рамките на няколко години. И тъй като пазарът расте, изследователите, фокусирани върху поверителността, все повече търсят начини да защитят хората от използването на гласовите им данни срещу тях.

Гласови заплахи

И думите, които казвате, и начина, по който казвате, могат да се използват, за да ви идентифицират, казва Еманюел Винсент, старши изследовател, специализиран в гласови технологии във френския Национален институт за изследвания в областта на цифровите науки и технологии (Inria), но това е само началото . „Ще намерите и друга информация за вашите емоции или медицинско състояние“, казва Винсент.

„Тези допълнителна информация помагат за изграждането на по-пълен профил – тогава това ще се използва за всякакви целеви реклами“, казва Винсент. Освен че вашите гласови данни потенциално се подават в огромната област от данни, използвани за показване на онлайн реклами, съществува и риск хакерите да получат достъп до местоположението, където се съхраняват гласовите ви данни, и да го използват, за да се представят за вас. Малък брой от тези инциденти с клониране са вече се случи, доказвайки стойността, която притежава вашият глас. Обикновените измами с автоматични обаждания също са записали хора, които казват „да“, за да използват потвърждението измами при плащане.

Миналата година TikTok промени политиките си за поверителност и започна събиране на гласови отпечатъци— Свободен термин за данните, които вашият глас съдържа — за хора в САЩ, заедно с други биометрични данни, като вашия отпечатък на лицето. В по-широк план, кол центровете използват AI за анализ на хора „Поведение и емоции“ по време на телефонни разговори и оценете „Тон, темп и височина на всяка една дума“ да се развие профили на хора и увеличаване на продажбите. „Почти сме в ситуация, в която системите за разпознаване кой сте и свързване на всичко заедно съществуват, но защитата не е налице – и все още е доста далеч от лесно използваема“, казва Хенри Търнър, който изследва сигурността на гласови системи в Оксфордския университет.

Скрит смисъл

Вашият глас се произвежда чрез a сложен процес включващи белите дробове и гласовата ви кутия, гърлото, носа, устата и синусите. Повече от сто мускула се активират, когато говорите, казва Ребека Клайнбергер, гласов изследовател в MIT Media Lab. „Това също е много мозък“, казва Клайнбергер.

Изследователите експериментират с четири начина за подобряване на поверителността на вашия глас, казва Наталия Томашенко, изследовател от университета в Авиньон, Франция, която изучава гласа и е първи автор на изследователска работа върху резултатите от a предизвикателство за инженерство за гласова поверителност. Нито един от методите не е перфектен, но се проучват като възможни начини за повишаване на поверителността в инфраструктурата, обработваща вашите гласови данни.

Първо е обфускирането, което се опитва напълно да скрие кой е говорещият. Помислете за холивудско изображение на хакер, който напълно изкривява гласа си по време на телефонно обаждане, докато обяснява дяволски заговор или откуп (или хактивистки колектив Промоционални видеоклипове на Anonymous). прост хардуер за промяна на гласа позволява на всеки бързо да промени звука на гласа си. По-усъвършенстваните системи за преобразуване на говор в текст могат да транскрибират това, което казвате, и след това обърнете процеса и кажете го с нов глас.

Второ, казва Томашенко, изследователите разглеждат разпределено и обединено обучение— Когато вашите данни не напускат вашето устройство, но моделите за машинно обучение все още се научават да разпознават говор споделяне на обучението си с по-голяма система. Друг подход включва изграждане на криптирана инфраструктура за защита на гласовете на хората от подслушване. Въпреки това, повечето усилия са насочени към анонимизиране на гласа.

Анонимизирането се опитва да запази гласа ви да звучи като човешки, като същевременно премахва възможно най-много от информацията, която може да се използва за идентифициране на вас. Понастоящем усилията за анонимизиране на говор включват две отделни направления: анонимизиране на съдържанието на това, което някой казва чрез изтриване или замяна на всички чувствителни думи във файловете, преди да бъдат запазени, и анонимизиране на самия глас. Повечето усилия за анонимизиране на гласа в момента включват предаване на нечий глас през експериментален софтуер, който ще промени някои от параметрите в гласовия сигнал, за да звучи различно. Това може да включва промяна на височината, замяна на сегменти от речта с информация от други гласове и синтезиране на крайния резултат.

.