Bagi yang tidak tahu, suara pada alat GPS anda dan juga respon automatik yang biasa anda dengar ketika menghubungi nombor sesebuah syarikat kebiasaannya bukanlah suara manusia sebenar. Dalam erti kata lain, suara-suara tersebut bukanlah dihasilkan daripada pangkalan data perkataaan-perkataan yang direkodkan oleh seseorang manusia.
Ayat-ayat yang anda dengar itu sebaliknya dihasilkan oleh komputer. Menariknya, suara yang dihasilkan itu kedengaran begitu semulajadi sehinggakan kita tidak dapat menjangkakan bahawa ianya bukanlah suara yang direkodkan terlebih dahulu dan dimainkan semula.
BESARKAN TEKS A- A+
Secara umumnya, suara manusia sangat kompleks dan rumit secara akustiknya berbanding bunyi salakan anjing dan bunyi yang dihasilkan oleh alatan muzik. Malah, keunikan suara manusia juga begitu jelas. Contohnya, seperti juga muka, tiada dua manusia yang mempunyai muka yang benar-benar sama antara satu sama lain.
Bukan itu sahaja, suara manusia juga dipengaruhi oleh emosi, tekanan pada suku kata dan juga loghat penuturnya. Merekod suara dan ucapan manusia serta memainkannya semula adalah sesuatu yang mudah. Namun, menghasilkan suara tiruan manusia bukanlah satu perkara yang mudah.
Usaha terawal menghasilkan suara tiruan
Mesin suara ciptaan Charles Wheatstone
Antara usaha terawal yang direkodkan untuk menghasilkan ucapan atau ayat daripada suara tiruan telah dilakukan lebih 200 tahun lalu sekitar tahun 1779 oleh seorang Professor dari Russia, Christian Kratzenstein.
Beliau ketika itu telah berjaya menghasilkan satu peralatan yang mempunyai beberapa lapisan besi bergetar yang mimik atau serupa dengan saluran vokal manusia. Alat ciptaannya ini boleh menghasilkan lima vokal panjang..
Beberapa tahun kemudian, pada tahun 1971, seorang pereka cipta dari Vienna bernama Wolfgang von Kempelen telah membina pula sebuah mesin yang lebih kompleks yang dibina berdasarkan mimik organ dalaman manusia seperti paru-paru, hidung, lidah dan bibir.
Sebagai contoh, bellow (sila rujuk gambar di atas) digunakan sebagai simulasi fungsi paru-paruh yang boleh mengembang dan menguncup, getaran besi yang berfungsi umpama saluran vokal, tiub yang diperbuat daripada kulit umpama saluran suara dan sebagainya. Dengan memanipulasikan bentuk tiub kulit dan posisi lidah dan bibir buatan tersebut, beliau mampu menghasilkan beberapa buah konsonan dan juga vokal.
Kira-kira setengah abad kemudiannya, Charles Wheatstone turut mencipta alat untuk menghasilkan suara tiruan dengan menambah baik alat ciptaan Wolfgang von Kempelen. Alat ciptaannya ini mampu untuk menghasilkan hampir kesemua sebutan huruf dan juga beberapa buah perkataan.
Penciptaan VODER
Alat pertama yang dianggap paling lengkap untuk menghasilkan suara tiruan adalah VODER, singkatan bagi Voice Operating Demonstrator. VODER dicipta pada tahun 1930-an oleh Homer Dudley dari syarikat Bell Labs.
Berbanding alat-alat ciptaan terawal, VODER jauh lebih kompleks dan rumit. Ia mempunyai papan kekunci seperti piano, satu bar yang dikawal pada pergelangan tangan dan pedal kaki dimana ianya boleh dimanipulasikan dan membolehkan mesin tersebut menghasilkan bunyi suara tiruan.
Suara yang dihasilkan pula umpama bunyi suara robot. Malah, kebanyakan suara tiruan yang berbunyi seperti suara robot dalam filem sains fiksyen dahulu kala juga berkemungkinan dihasilkan oleh mesin VODER. Penciptaan VODER secara tidak langsung merupakan permulaan kepada penggunaan suara tiruan dengan lebih meluas.
Kesukaran menggunakan VODER
Tidak semua orang mampu menggunakan VODER dengan betul. Salah seorang yang pakar menggunakan alat ini adalah Mrs. Helen Harper yang telah membuat demonstrasi di sebuah festival di New York pada tahun 1939.
Sebagai contoh, untuk menghasilkan bunyi "concentration" pada VODER, beliau perlu menghasilkan 13 bunyi suara berlainan secara berturut-turut dan membuat 5 pergerakan naik dan turut bar yang dikawal menggunakan pergelangan tangannya.
Pada masa yang sama, beliau perlu melakukan pergerakan kaki bagi mengawal kedudukan pedal kaki sebanyak 3 hingga 5 kali berpandukan ekspresi bunyi yang ingin dihasilkan melalui VODER. Kesemua ini perlu dilakukan pada masa yang sama!
Mrs. Helen Harper mengambil masa kira-kira 1 tahun sebelum benar-benar mahir menggunakan VODER untuk menghasilkan suara tiruan. Daripada lebih 300 wanita yang belajar menggunakannya, hanya kurang daripada 30 orang yang benar-benar mahir menggunakannya.
Seorang operator VODER yang pakar seperti beliau mampu menghasilkan pelbagai bunyi dan sebutan daripada mesin ini. Ini termasuklah bunyi haiwan seperti lembu. Sila tonton video ringkas di atas untuk melihat demonstrasi bagaimana mesin ini berfungsi.
Kredit: