1. Türk Yapay Zeka ve Yapay Sinir Ağları Sempozyum
  • 1. Türk Yapay Zeka ve Yapay Sinir Ağları Sempozyumu Bildirileri
  • ÖNSÖZ
  • TEŞEKKÜR
  • İÇİNDEKİLER
  • Davetli Bildiri - Invited Paper
    • Towards Program Understanding Systems
  • Akıl Yürütme - Reasoning
    • Proof-Checking Process-Based Reasoning about Physical Systems
    • An Extension of the Corresponding Value Technique in Qualitative Modeling and Simulation
    • Qualitative Reasoning Experiments with the MVL Theorem Proving System
    • Tekdüze Olmayan Usavurum Yöntemleri ve Yapay Zeka
    • Issues in Commonsense Set Theory
  • Yapay Sinir Ağları Uygulamaları - Applications of Artificial Neural Networks
    • A Survey of Neural Network Applications for Scheduling Problems
    • A Study in Connectionist Modeling of Hard-Constraint Problems: Solving Tangram Puzzles
    • Solving Maze Problems by Cellular Neural Networks
    • Ping-Pong Oynamasını Öğrenen Yapay Sinir Ağı
  • Doğal Diller - Bilgi Gösterimi / Natural Languages - Knowledge Representation
    • Towards a Formal Semantics of Turkish
    • An Approach to Machine Translation
    • Functional Categorization of Knowledge
    • Four Levels of Learning and Representation in Modeling Scientific Discovery
  • Konuşma Tanıma/ Speech Recognition
    • Konuşma İşaretinin Tanınması için Kullanılan Yapay Nöron Ağları ve Diğer Teknikler
    • Isolated Speech Recognition System
    • Vocal Tract Shape Estimation
    • Comparison of Human and Lovebird Speech
  • Yapay Sinir Ağları Yapıları/ Artificial Neural Network Architectures
    • Artificial Neural Networks that Grow When They Learn and Shrink When They Forget
    • Sinir Ağlarının Optik Cihazlarla Tasarımı
    • Classification and Computation on Non-uniform Finite Cellular Automata Networks
    • Yapay Sinir Ağları Konusunda Hukuki bir Yaklaşım
  • Tasarımda Yapay Zeka / Artificial Intelligence in Design
    • Fuzzy Lojik Kontrolerlerin Dizaynı için Yeni bir Metod
    • Bilgi Tabanlı Yaratıcı Kavramsal Dizayn
    • A Distributed Expert System Architecture
    • KNOWALL! An Experimental Inscriptor-Based Expert System
  • Örüntü Tanıma / Pattern Recognition
    • A Counterpropagation Network Model to Recognize and Classify Chart Patterns in Automated Manufact.
    • Experiments with RST, A Rotation, Scaling and Translation Invariant Pattern Classification System
    • Application of Artificial Neural Networks to Pattern Recognition
    • Segmentation of Ottoman Characters
  • Görme ve Görüntü İşleme / Vision and Image Processing
    • Active Vision / Etkin Görme
    • Renkli Resim İşlemenin Teorik ve Pratik Özellikleri
    • Otomatik Odaklama
    • Executing Prolog Programs with Dataflow Approach
  • Yapay Sinir Ağları Uygulamaları / Application of Artificial Neural Networks
    • A Neural Network Architecture for Emulating Forward Dynamics of a Robot Manipulator
    • Stability Properties of Artificial Neural Network Based Robotic Controllers
    • Pattern Classifier
    • Yapay Sinir Ağlarının Robotikteki Uygulamaları
  • Yazar Dizini / Author Index
Powered by GitBook
On this page
  • Abstract
  • Özet
  • Tam Metin

Was this helpful?

  1. Konuşma Tanıma/ Speech Recognition

Vocal Tract Shape Estimation

M. B. Gülmezoğlu, A. Barkana, Anadolu Üniversitesi, Türkiye.

Abstract

The previous works done by other researchers to determine the cross-sectional areas of the vocal tract assumes that the glottal wave shape consists of only an impulse for each vibration of the vocal cords.

At the beginning of this work, it was expected that if the actual sawtooth input signal is taken as the glottal wave input, obtained cross-sectional areas of the vocal tract can be closer to actual ones. Input signals from the glottis and the output signals Irom the lips are measured and digitized simultaneously with the sampling frequency of 10kHz.

In this work, the transfer function of the vocal tract is obtained by using least-squares technique. The coefficients of the denominator polynomial of the transfer function are used to determine the cross-sectional areas of the vocal tract.

At first, the previous ·works whicb assume an impulse wave shape for the input is also repeated to find the cross-sectional areas of the vocal tract. It is observed that the obtained areas are similar to previous ones.

In the second step, the cross-sectional areas obtained by taking the actual input signal as the glottal wave input. The results of this work are compared with the work which takes the impulse signal as the glottal wave input.

The work with actual input signal seems to yield the position of the constriction point of the tongue better than the results of the previous work.

Özet

Diğer araştırmacılar tarafından, ses yolunun enine kesit alanlarını belirlemek için yapılan önceki çalışmalar, glottal dalga şeklinin, sadece ses tellerinin her titreşimi için bir dürtüden oluştuğunu varsayar.

Bu çalışmanın başlangıcında, gerçek testere dişi giriş sinyali glottal dalga girişi olarak alındığında, vokal kanalın kesit alanlarının fiili olanlara daha yakın olabileceği beklenmektedir. Glottisten gelen giriş sinyalleri ve dudaklardan çıkan sinyaller, 10kHz örnekleme frekansıyla aynı anda ölçülür ve dijitalleştirilir.

Bu çalışmada, en küçük kareler tekniği kullanılarak ses yolunun transfer fonksiyonu elde edilmiştir. Transfer fonksiyonunun paydas polinomunun katsayıları, ses yolunun kesit alanlarını belirlemek için kullanılır.

İlk başta, girdi için bir dürtü dalgası şeklini alan önceki çalışmalar, ses yolunun kesit alanlarını bulmak için de tekrarlanır. Elde edilen alanların öncekine benzer olduğu görülmektedir.

İkinci aşamada, gerçek giriş sinyali glottal dalga girişi olarak alınarak elde edilen kesitsel alanlar. Bu çalışmanın sonuçları, impuls sinyalini glottal dalga girişi olarak alan çalışmayla karşılaştırılır.

Gerçek giriş sinyaliyle yapılan çalışma, dilin daralma noktasının konumunu önceki çalışmaların sonuçlarından daha iyi veriyor gibi görünüyor.

Tam Metin

Bildirinin tamamını görüntülemek için aşağıdaki dosyayı indiriniz.

PreviousIsolated Speech Recognition SystemNextComparison of Human and Lovebird Speech

Last updated 5 years ago

Was this helpful?

13MB
161-169.pdf
pdf
161-169 Vocal Tract Shape Estimation