TEKNOLOGI PENGENALAN SUARA (VOICE RECOGNITION)
A. PENGERTIAN
SPEECH RECOGNITION
Speech Recognition adalah proses identifikasi suara
berdasarkan kata yang diucapkan dengan melakukan konversi sebuah sinyal
akustik, yang ditangkap oleh audio device (perangkat input suara).Speech Recognition
juga merupakan sistem yang digunakan untuk mengenali
perintah kata dari suara manusia dan kemudian diterjemahkan menjadi suatu data yang dimengerti oleh komputer. Pada saat ini, sistem ini digunakan untuk menggantikan peranan input dari keyboard dan mouse.
perintah kata dari suara manusia dan kemudian diterjemahkan menjadi suatu data yang dimengerti oleh komputer. Pada saat ini, sistem ini digunakan untuk menggantikan peranan input dari keyboard dan mouse.
Keuntungan dari sistem ini adalah pada kecepatan dan
kemudahan dalam penggunaannya. Kata – kata yang ditangkap dan dikenali bisa
jadi sebagai hasil akhir, untuk sebuah aplikasi seperti command & control,
penginputan data, dan persiapan dokumen. Parameter yang dibandingkan ialah
tingkat penekanan suara yang kemudian akan dicocokkan dengan template database
yang tersedia. Sedangkan sistem pengenalan suara berdasarkan orang yang
berbicara dinamakan speaker recognition.
B. SEJARAH
SPEECH RECOGNITION
Biometrik, termasuk di dalamnya speech recognition,
secara umum digunakan untuk identifikasi dan verifikasi. Identifikasi ialah
mengenali identitas subyek, dilakukan perbandingan kecocokan antara data
biometric subyek dalam database berisi record karakter subyek. Sedangkan
verifikasi adalah menentukan apakah subyek sesuai dengan apa yang dikatakan
terhadap dirinya.
Biometrik merupakan suatu metoda untuk mengenali
manusia berdasarkan pada satu atau lebih ciri-ciri fisik atau tingkah laku yang
unik. Biometric Recognition atau biasa disebut dengan Sistem pengenalan
biometric mengacu pada identifikasi secara otomatis terhadap manusia
berdasarkan psikological atau karakteristik tingkah laku manusia. Ada beberapa
jenis teknologi biometric antara lain suara (speech recognition).
Metode Hidden Markov Model mulai diperkenalkan dan
dipelajari pada akhir tahun 1960, metode yang berupa model statistik dari
rantai Markov ini semakin banyak dipakai pada tahun-tahun terakhir terutama
dalam bidang speech recognition, seperti dijelaskan oleh Lawrence R. Rabiner
dalam laporannya yang berjudul “A Tutorial on Hidden Markov Models and Selected
Applications in Speech Recognition”
C. JENIS
– JENIS SPEECH RECOGNITION
Berdasarkan kemampuan dalam mengenal kata yang
diucapkan, terdapat 5 jenis pengenalan kata, yaitu :
1. Kata-kata yang terisolasi
1. Kata-kata yang terisolasi
Proses pengidentifikasian
kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki
jeda waktu pengucapan antar kata.
2. Kata-kata yang berhubungan
2. Kata-kata yang berhubungan
Proses pengidentifikasian
kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu
pengucapan antar kata yang lebih singkat.
3. Kata-kata yang berkelanjutan
3. Kata-kata yang berkelanjutan
Proses pengidentifikasian
kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan
secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda
waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode
khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna
perangkat ini dapat mengucapkan kata-kata secara natural.
4. Kata-kata spontan
4. Kata-kata spontan
Proses pengidentifikasian
kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda
waktu antar kata.
5. Verifikasi atau identifikasi suara
Proses pengidentifikasian
kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa
yang berbicara.
D. IMPLEMENTASI
1.
Sound
card
Merupakan
perangkat yang ditambahkan dalam suatu Komputer yang fungsinya sebagai
perangkat input dan output suara untuk mengubah sinyal elektrik, menjadi analog
maupun menjadi digital.
2.
Microphone
Perangkat
input suara yang berfungsi untuk mengubah suara yang melewati udara, air dari
benda orang menjadi sinyal elektrik.
3.
Komputer
atau Komputer Server
Dalam
proses suara digital menterjemahkan gelombang suara menjadi suatu simbol
biasanya menjadi suatu nomor biner yang dapat diproses lagi kemudian
diidentifikasikan dan dicocokan dengan database yang berisi berkas
suara agar dapat dikenali.
E. SUMBER
Tidak ada komentar :
Posting Komentar