ศิลปินชาวอังกฤษที่สูญเสียความสามารถในการพูดจากโรคเซลล์ประสาทเสื่อม (MND) กว่า 25 ปี ได้ฟื้นคืนเสียงพูดเดิมด้วยเทคโนโลยี AI และคลิปวิดีโอเก่าเพียง 8 วินาที
Sarah Ezekiel ศิลปินจากลอนดอนเหนือ สูญเสียเสียงพูดหลังได้รับการวินิจฉัยว่าเป็นโรค MND ตั้งแต่อายุ 34 ปี ขณะตั้งครรภ์ลูกคนที่สอง เมื่อ 25 ปีที่แล้ว โรคนี้ทำลายระบบประสาทอย่างต่อเนื่อง ส่งผลเสียต่อกล้ามเนื้อลิ้น ปาก และคอ ทำให้ผู้ป่วยบางรายสูญเสียการพูดโดยสิ้นเชิง
การใช้เทคโนโลยีสื่อสารทางเลือก
หลังได้รับการวินิจฉัย Ezekiel ใช้คอมพิวเตอร์และเทคโนโลยีสังเคราะห์เสียงช่วยในการสื่อสารแต่เสียงที่ได้ไม่คล้ายเสียงเดิมของเธอเลย ลูกทั้งสองคน Aviva และ Eric จึงเติบโตมาโดยไม่เคยรู้ว่าแม่พูดได้อย่างไร
เธอยังคงประกอบอาชีพศิลปินโดยใช้เมาส์คอมพิวเตอร์สร้างสรรค์ผลงาน แม้จะสูญเสียการใช้เสียงไป
ความท้าทายในการสร้างเสียงดิจิทัล
Simon Poole จากบริษัทสื่อสารการแพทย์ Smartbox อธิบายว่า การสร้างเสียงดิจิทัลที่คล้ายคลึงเดิมต้องการไฟล์เสียงคุณภาพดีและยาวหลายชั่วโมง แต่เสียงที่ได้มักจะ เรียบเฉยและระดับเสียงเดียว
เมื่อทีมขอไฟล์เสียงจาก Ezekiel หนึ่งชั่วโมง เธอหาได้เพียงคลิปสั้น 8 วินาทีจากวิดีโอบ้านยุค 1990 ที่มีเสียงแว่วและเสียงรบกวนจากทีวี
การพัฒนาเทคโนโลยี AI ใหม่
Poole หันไปใช้เทคโนโลยีจาก ElevenLabs บริษัท AI ด้านเสียงในนิวยอร์ก ที่สามารถสร้างเสียงจากข้อมูลน้อยและทำให้ฟังดูเป็นธรรมชาติ เครื่องมือ AI ตัวแรกแยกตัวอย่างเสียงจากคลิป ส่วนตัวที่สองซึ่งฝึกจากเสียงจริงช่วยเติมส่วนที่ขาดหาย
ผลลัพธ์ที่ได้ใกล้เคียงเสียงเดิมของ Ezekiel รวมถึงสำเนียงลอนดอนและการออกเสียง 's' ที่เธอเคยไม่ชอบ เธอเขียนอีเมลตอบกลับว่า เกือบจะร้องไห้เมื่อได้ยิน และเมื่อเล่นให้เพื่อนที่รู้จักก่อนสูญเสียเสียงฟัง เหมือนได้เสียงเดิมคืนมา
ผลกระทบต่อผู้ป่วย MND
ตามข้อมูลสมาคมโรคเซลล์ประสาทเสื่อมแห่งอังกฤษ ผู้ป่วย 8 ใน 10 รายประสบปัญหาเสียงหลังการตรวจพบ เสียงสังเคราะห์ปัจจุบันมักฟังเหมือนหุ่นยนต์
Poole กล่าวว่า ความก้าวหน้าของเทคโนโลยี AI คือการสร้างเสียงที่มีความเป็นมนุษย์และแสดงอารมณ์ได้ การปรับแต่งเสียงเป็นวิธีรักษาอัตลักษณ์โดยเฉพาะผู้ที่สูญเสียเสียงในภายหลัง การพูดด้วยเสียงเดิมมีความสำคัญมากกว่าการใช้เสียงสำเร็จรูป