(SeaPRwire) –   PROVIDENCE, R.I. — Tiếng nói của Alexis “Lexi” Bogan trước mùa hè năm ngoái rất hào hứng.

Cô thích hát lớn những bài hát của Taylor Swift và Zach Bryan trong xe hơi. Cô cười suốt – ngay cả khi dẫn dắt những đứa trẻ mẫu giáo khóc lóc hoặc tranh luận chính trị với bạn bè quanh đống lửa trại sau vườn. Ở trường trung học, cô là giọng nữ trong dàn hợp xướng.

Rồi tiếng nói ấy biến mất.

Bác sĩ vào tháng Tám đã loại bỏ một khối u đe dọa tính mạng nằm gần phía sau não. Khi ống thở ra khỏi một tháng sau, Bogan gặp khó khăn trong việc nuốt và cố nói “chào” với bố mẹ mình. Nhiều tháng phục hồi giúp cải thiện tình trạng của cô, nhưng giọng nói của cô vẫn bị ảnh hưởng. Bạn bè, người lạ và thậm chí gia đình cô cũng khó hiểu những gì cô đang cố gắng nói.

Vào tháng Tư, cô gái 21 tuổi đã lấy lại giọng nói cũ. Không phải giọng thật, mà là giọng sao chép được tạo ra bởi OpenAI mà cô có thể gọi từ ứng dụng trên điện thoại. Được huấn luyện trên một đoạn video nấu ăn dài 15 giây – nguồn gốc từ video mà cô ghi lại cho dự án trường trung học – giọng nói nhân tạo nhưng rất giống thật của cô bây giờ có thể nói gần như bất cứ điều gì cô muốn.

Cô gõ vài từ hoặc câu vào điện thoại và ứng dụng sẽ đọc ngay lập tức.

“Xin chào, tôi có thể nhận một ly cà phê espresso nâu đường dâu sữa hạt oat đảo không,” giọng nói AI của Bogan khi cô cầm điện thoại ra cửa sổ xe hơi tại quầy thức uống của Starbucks.

Các chuyên gia cho rằng công nghệ sao chép giọng nói AI ngày càng phát triển nhanh có thể khuyến khích lừa đảo qua điện thoại, làm xáo trộn và xâm phạm danh dự của những người – còn sống hay đã khuất – không bao giờ đồng ý cho phép giọng nói của họ được tái tạo để nói những điều họ chưa bao giờ nói.

Công nghệ này đã được sử dụng để tạo ra cuộc gọi giả mạo đến cử tri New Hampshire mô phỏng Tổng thống Joe Biden. Ở Maryland, một người đã bị buộc tội sử dụng AI để tạo ra một đoạn âm thanh giả mạo hiệu trưởng trường phổ thông nói những lời mang tính chủng tộc.

Nhưng Bogan và nhóm bác sĩ tại nhóm bệnh viện Lifespan ở Rhode Island tin rằng họ đã tìm thấy một cách sử dụng công nghệ này một cách chính đáng. Bogan là một trong những người đầu tiên – duy nhất với tình trạng của cô – có thể tái tạo lại giọng nói đã mất với Công cụ Giọng nói mới của OpenAI.

“Chúng tôi hy vọng Lexi sẽ mở đường khi công nghệ phát triển,” Bác sĩ Rohaid Ali, bác sĩ phẫu thuật thần kinh tại Trường Y học Brown và Bệnh viện Rhode Island nói. Hàng triệu người bị tai biến mạch máu não, ung thư cổ họng hoặc bệnh thần kinh tiêu hao có thể hưởng lợi, ông nói.

“Chúng ta nên nhận thức được rủi ro, nhưng chúng ta không thể quên đi bệnh nhân và lợi ích xã hội,” Bác sĩ Fatima Mirza, một bác sĩ phụ tá khác làm việc trên dự án thí điểm nói. “Chúng tôi có thể giúp Lexi lấy lại giọng nói thật của mình và cô ấy có thể nói bằng ngôn ngữ phản ánh bản thân mình nhất.”

Mirza và Ali, người đã kết hôn, thu hút sự chú ý của OpenAI – nhà sản xuất ChatGPT – bởi nghiên cứu dự án trước đó tại Lifespan sử dụng trò truyện AI để đơn giản hóa các mẫu đồng ý y tế cho bệnh nhân. Công ty ở San Francisco liên lạc khi đang tìm kiếm các ứng dụng y tế triển vọng cho Công cụ Giọng nói mới của họ đầu năm nay.

Bogan vẫn đang hồi phục từ từ sau cuộc phẫu thuật. Bệnh bắt đầu mùa hè năm ngoái với các cơn đau đầu, mờ mắt và mặt rụng xuống, khiến bác sĩ tại Bệnh viện Nhi đồng Hasbro ở Providence hoảng sợ. Họ phát hiện ra một khối u mạch máu kích thước bằng quả golf ép lên thân não và mắc kẹt trong mạch máu và dây thần kinh sọ não.

“Đó là một trận chiến để kiểm soát chảy máu và loại bỏ khối u,” Bác sĩ phẫu thuật não nhi Konstantina Svokos nói.

Thời gian 10 tiếng của cuộc phẫu thuật cộng với vị trí và mức độ nghiêm trọng của khối u đã làm hư hại cơ lưỡi và dây thanh quản của Bogan, ảnh hưởng đến khả năng ăn và nói của cô, Svokos cho biết.

“Điều gần như giống như một phần bản sắc của tôi bị lấy đi khi tôi mất giọng nói,” Bogan nói.

Ống dẫn thức ăn ra ngoài năm nay. Trị liệu ngôn ngữ vẫn đang tiếp tục, giúp cô có thể nói rõ ràng trong một căn phòng yên tĩnh nhưng không có dấu hiệu cô sẽ lấy lại toàn bộ sự trong suốt của giọng nói tự nhiên.

“Tại một thời điểm nào đó, tôi bắt đầu quên mất tôi nghe như thế nào,” Bogan nói. “Tôi đã quen với cách tôi nghe bây giờ.”

Mỗi khi điện thoại reo tại nhà của gia đình ở vùng ngoại ô North Smithfield của Providence, cô sẽ đẩy nó sang cho mẹ để nghe cuộc gọi thay cho cô. Cô cảm thấy mình là gánh nặng cho bạn bè mỗi khi họ đi ăn tại nhà hàng ồn ào. Bố cô, người bị mất thính lực, cũng khó hiểu cô.

Trở lại bệnh viện, các bác sĩ đang tìm kiếm một bệnh nhân thí điểm để thử nghiệm công nghệ của OpenAI.

“Người đầu tiên đến với tâm trí của Bác sĩ Svokos là Lexi,” Ali nói. “Chúng tôi liên hệ với Lexi để xem cô ấy có quan tâm không, không biết phản hồi của cô ấy sẽ ra sao. Cô ấy sẵn sàng thử và xem nó hoạt động như thế nào.”

Bogan phải quay lại vài năm để tìm một bản ghi âm phù hợp của giọng nói để “huấn luyện” hệ thống AI hiểu cách cô nói. Đó là một video mà cô giải thích cách làm món salad pasta.

Bác sĩ của cô cố ý cung cấp cho AI chỉ một đoạn dài 15 giây. Âm thanh nấu ăn làm cho các phần còn lại của video không hoàn hảo. Nhưng đó cũng là tất cả những gì OpenAI cần – một cải tiến so với công nghệ trước đây yêu cầu mẫu giọng nói dài hơn nhiều.

Họ cũng biết rằng việc lấy ra được điều gì đó hữu ích từ 15 giây có thể quan trọng đối với bất kỳ bệnh nhân tương lai nào không có dấu vết giọng nói trên internet. Một tin nhắn thoại ngắn gọi cho người thân có thể phải đủ.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác. 

Khi thử nghiệm lần đầu, mọi người đều ngạc nhiên trước chất lượng của bản sao giọng nói. Những lỗi nhỏ như phát âm sai từ hoặc thiếu điệu hướng hầu hết không thể nhận th

Author

eva@pressvn.com