Tacotron 2 (ทาโคตรอน สอง) สร้างเสียงเหมือนมนุษย์จากปัญญาประดิษฐ์ (AI)
ในโลกปัจจุบันนั้นเทคโนโลยีต่างๆได้พัฒนาและก้าวหน้าไปไกลจนน่าตกใจ ล่าสุดเราจะได้ยินเรื่อง AI กันมาในหลายๆด้านว่าสามารถทำงานทดแทนมนุษย์ได้ ซึ่งทำให้ผู้คนตกงานกันเป็นจำนวนมาก ล่าสุดทาง Google (กูเกิ้ล) ได้สร้าง AI (เอไอ) ที่สามารถทำเสียงเหมือนมนุษย์ได้ Google อ้างว่าระบบสังเคราะห์เสียงพูดจากปัญญาประดิษฐ์ (AI) เวอร์ชั่นล่าสุดที่มีชื่อว่า "Tacotron 2" สามารถสังเคราะห์เสียงได้ชนิดที่เรียกว่าแทบแยกกับเสียงมนุษย์จริงไม่ออก
Tacotron 2 (ทาโคตรอน สอง) ทำงานโดยตรงกับตัวอักษรและ Google ระบุว่ามันสามารถใช้บริบทเพื่อที่จะอ่านออกเสียงได้อย่างถูกต้อง แม้จะเป็นคำที่สะกดเหมือนกันอย่างคำว่า read กริยาช่อง 1 และ read กริยาช่อง 3 ก็ตาม สามารถตอบสนองต่อวรรคตอน การใส่จุลภาคและเรียนรู้คำที่เน้นเสียงหนัก รวมถึงวิเคราะห์เครื่องหมายคำถาม เพื่อปรับโทนเสียงได้อีกด้วย
โดยเดฟ เกิร์ชกอน อธิบายหลักการทำงานของ Tacotron 2 ไว้ว่า เป็นเทคโนโลยี Neural Network (เนรวล เน็ตเวิค) เชิงลึก 2 ส่วนมาประกอบกัน ส่วนแรกจะแปลข้อความจากตัวอักษรให้อยู่ในรูป Spectogram (สเปคโตแกรม) ซึ่งเป็นการแสดงภาพเพื่อแทนความถี่เสียงตามเวลา จากนั้น Spectogram จะถูกส่งเข้าสู่ AI ที่ชื่อว่า WaveNet (เวฟเน็ต) ที่สร้างโดยบริษัท Alphabet (อัลพาเบ็ต) (บริษัทแม่ของ Google) ซึ่งจะอ่านแผนภูมิดังกล่าวและแปลงเป็นเสียงต่อไป
Google ไม่ได้บอกออกมาตรงๆ ว่าในตัวอย่างเปรียบเทียบที่เผยแพร่อยู่ทางออนไลน์นั้น เสียงใดเป็นเสียงมนุษย์จริง หรือเสียงใดเป็นเสียงสังเคราะห์ แต่เกิร์ชกอน บอกว่าถ้ากด View Source (วิวสอช) ในหน้าเว็บก็รู้จากชื่อไฟล์ได้ทันที ดังนั้นถ้าไม่อยากถูกสปอยล์ก็ลองฟังกันก่อนนะครับ สามารถทดสอบฟังเทียงได้ที่ google.github.io
ข้อมูลจาก : 9to5google.com