Evoluție periculoasă. Vocile generate de inteligența artificială sunt acum imposibil de distins de cele umane, avertizează cercetătorii

Date:

Vocile generate de inteligența artificială (AI) sunt acum atât de realiste încât majoritatea oamenilor nu pot face diferența între o voce umană reală și una „deepfake”. Acest lucru a fost demonstrat într-un studiu recent publicat în revista PLoS One, în care cercetătorii au arătat că, atunci când oamenii ascultă voci umane alături de versiuni generate de AI ale acelorași voci, nu pot identifica precis care sunt reale și care sunt false.

Majoritatea dintre noi am experimentat probabil vocile inteligenței artificiale prin intermediul asistenților personali precum Siri sau Alexa, cu intonația lor monotonă și pronunția mecanică, care ne dau impresia că putem distinge cu ușurință între o voce generată de AI și o persoană reală. Dar oamenii de știință spun că ascultătorul obișnuit nu mai poate face acum diferența între vocile reale și vocile „deepfake”.

Studiul a sugerat că, în timp ce vocile generice, create de la zero, nu erau considerate realiste, clonele vocale antrenate pe vocile unor persoane reale – audio deepfake – s-au dovidit a fi la fel de credibile ca și omologii lor din viața reală. Oamenii de știință au dat participanților la studiu mostre de 80 de voci diferite (40 de voci generate de AI și 40 de voci umane reale) și le-au cerut să eticheteze care dintre ele considerau că sunt reale și care generate de AI.

În medie, doar 41% dintre vocile AI create de la zero au fost clasificate eronat ca fiind umane, ceea ce sugerează că, în majoritatea cazurilor, este încă posibil să le deosebești de persoanele reale. Cu toate acestea, în cazul vocilor generate de AI clonate de la oameni, majoritatea (58%) au fost clasificate eronat ca fiind umane. Doar puțin mai mult (62%) dintre vocile umane au fost clasificate corect ca fiind umane, ceea ce i-a determinat pe cercetători să concluzioneze că nu există o diferență statistică în capacitatea noastră de a distinge vocile persoanelor reale de clonele lor deepfake.

Rezultatele au implicații potențial profunde pentru etică, drepturile de autor și securitate. Dacă infractorii ar folosi AI pentru a clona vocea ta, ar deveni mult mai ușor să ocolească protocoalele de autentificare vocală la bancă sau să-ți păcălească persoanele dragi să transfere bani. Am asistat deja la mai multe incidente de acest gen.

Vocile AI realiste pot fi folosite și pentru a fabrica declarații și interviuri cu politicieni sau celebrități. Înregistrările audio false pot fi folosite pentru a discredita persoane sau pentru a incita la tulburări, semănând diviziune socială și conflicte. Cercetătorii au subliniat că clonele vocale pe care le-au folosit în studiu nu erau nici măcar deosebit de sofisticate. Le-au creat cu ajutorul unui software disponibil în comerț și le-au antrenat cu doar patru minute de înregistrări vocale umane.

Procesul a necesitat cunoștințe minime, doar câteva minute de înregistrări vocale și aproape niciun cost financiar. Acest lucru demonstrează cât de accesibilă și sofisticată a devenit tehnologia vocală bazată pe inteligența artificială. Deși deepfake-urile oferă o multitudine de oportunități pentru actorii răuvoitori, nu totul este negativ; pot exista și oportunități mai pozitive care vin odată cu puterea de a genera voci AI la scară largă.

Ar putea exista aplicații pentru îmbunătățirea accesibilității, educației și comunicării, unde vocile sintetice personalizate de înaltă calitate pot îmbunătăți experiența utilizatorului. Într-adevăr, beneficiile potențiale ale tehnologiei vocale bazate pe inteligența artificială sunt imense, dar este important să fim conștienți de riscurile și implicațiile etice ale acestei tehnologii încontinuu în dezvoltare.

Share post:

Popular

Mai multe articole asemănătoare
Știri

Imagine principalaImagine secundara Imagine tertiara