பேச்சு அங்கீகாரத்தில் AI எதிர்கொள்ளும் 6 சிக்கல்கள்

அனைத்து பெரிய நிறுவனங்களும் குரல் அங்கீகாரத்தில் முதலீடு செய்கின்றன, மேலும் செயற்கை நுண்ணறிவின் (AI) புதிய தொழில்நுட்பத்துடன் உலகம் மெதுவாக இன்னும் சீராக சரிசெய்கிறது. ஆகவே இது ஏன் இவ்வளவு நேரம் எடுத்துக்கொள்கிறது, இது ஏன் நம் அன்றாட வாழ்க்கையின் ஒரு பகுதியாக இல்லை? இதற்கான 6 காரணங்கள் இங்கே.

ஒரு பொருளின் குறிப்பிட்ட நிறம் மற்றும் பிராண்டைத் தேட நீங்கள் ஒரு கடைக்குச் செல்கிறீர்கள். நீங்கள் விரும்பும் தயாரிப்பு கிடைக்குமா என்று ஒரு ஊழியரிடம் கேட்கிறீர்கள். ஊழியர் கிடங்கிற்குச் சென்று, தயாரிப்புக்கான தனது சரக்குகளைச் சரிபார்த்து, சிறிது நேரம் கழித்து திரும்பி வருகிறார், உங்கள் தயாரிப்பு இனி கிடைக்காது என்று உங்களுக்குச் சொல்ல மட்டுமே.

இப்போது இதை கற்பனை செய்து பாருங்கள், நீங்கள் அதே கடையில் நுழைந்து ஒரு சிறிய சாதனத்தை நீங்கள் வாங்க விரும்பும் பொருளைச் சொல்லுங்கள். ஒரு நொடிக்குள், உங்கள் தயாரிப்பின் சரியான கிடைக்கும் தன்மையை ஒரு குரல் உங்களுக்குக் கூறுகிறது, கிடைக்கவில்லை எனில், தயாரிப்பு கிடைக்கக்கூடிய விற்பனை நிலையங்களில் விவரங்களைத் தருகிறது.

AI சாதனம் அனைத்து டிஜிட்டல் சரக்கு அமைப்புகள் மூலமாகவும் ஸ்கேன் செய்வதன் மூலம் இதைச் செய்கிறது. செலவு தளவாடங்கள் மற்றும் மிக முக்கியமாக வசதி தொடர்பாக ஏராளமான நன்மைகளுடன், பேச்சு அங்கீகாரம் மற்றும் தனிப்பட்ட உதவியாளர்களின் கலை ஏன் இன்னும் முழுமையாக்கப்படவில்லை?

ஒலி அலை அங்கீகாரத்தில் விஞ்ஞானம் பெரும் முன்னேற்றம் காணும்போது, ​​உரையை உரையை டிகோட் செய்யும் போது ஆராய்ச்சியாளர்கள் எதிர்கொள்ளும் சில முக்கிய சிக்கல்களைப் பார்ப்போம்.

சத்தம்

குரல் பதிவு இயந்திரங்கள் பேச்சு மூலம் உருவாக்கப்படும் ஒலி அலைகளைக் கண்டறிகின்றன. அறைகளில் உள்ள பின்னணி இரைச்சல்கள் ஹோஸ்ட் குரலிலிருந்து குறிப்பிட்ட ஒலி அலைகளை அமைப்புகள் புரிந்துகொள்வதையும் வேறுபடுத்துவதையும் கடினமாக்குகின்றன. இது சாதனங்களால் எடுக்கப்பட்ட ஒலியை மழுங்கடிக்கிறது, குழப்பமடைகிறது மற்றும் அதன் செயலாக்க திறனைக் கட்டுப்படுத்துகிறது.

எதிரொலி

எதிரொலிகள் அடிப்படையில் சுவர்கள், அட்டவணைகள் அல்லது பிற தளபாடங்கள் போன்ற பல்வேறு மேற்பரப்புகளில் பிரதிபலிக்கும் ஒலி-அலைகள். இது ஒலி அலைகளை ஏற்பிகளுக்குத் திரும்பச் செய்வதற்கு வழிவகுக்கிறது, இதனால் தெளிவு குறைகிறது.

உச்சரிப்புகள்

ஒவ்வொரு மொழியிலும் பரவலான உச்சரிப்புகள் பேச்சு அங்கீகாரத்தில் சிரமங்களுக்கு வழிவகுக்கும் மற்றொரு காரணியாகும். ஒரே வார்த்தையை பல வழிகளில் உச்சரிக்க முடிந்தால், ஒரே வார்த்தையின் எழுத்துக்கள் மற்றும் ஒலிப்பியல் வேறுபடுகின்றன, இதனால் இயந்திரத்தை செயலாக்குவது கடினம்.

ஒத்த ஒலிகள்

இதேபோன்ற ஒலி சொற்கள் மற்றும் சொற்றொடர்கள் குரல் செய்தியின் சரியான குறியாக்கத்தையும் டிகோடிங்கையும் தடுக்கலாம். எடுத்துக்காட்டாக, “ஒரு நல்ல கடற்கரையை அழிப்போம்” மற்றும் “பேச்சை அங்கீகரிப்போம்” என்பது ஒலிப்பு ரீதியாக மிகவும் ஒத்தவை, மேலும் சாதனத்தை எளிதில் குழப்பக்கூடும்.

இயந்திர பிழை

குரல் கண்டறிதலின் துல்லியமான நிலைகள் அதிக பிழை விகிதங்களைக் கொண்டுள்ளன. இயந்திரங்கள் இன்னும் 8% -12% பிழைகளை எதிர்கொள்கின்றன, இது மனிதர்கள் தங்கள் அன்றாட பேச்சில் செய்வதை விட இரண்டு மடங்கு அதிகம். சேகரிக்கப்பட்ட தரவின் குறியாக்கத்தில் உள்ள பிழைகள் செயல்திறனுக்கு முக்கியமானவை, ஏனெனில் இது குரல் பதிவு சாதனங்கள் செயல்படுவதற்கான முதல் படியாகும்.

ஒழுங்கற்ற பேச்சு

எங்கள் அன்றாட உரையாடல்களில் சொற்களை ஒன்றிணைப்பது, பல சொற்களும் சொற்றொடர்களும் ஒன்றிணைகின்றன என்பதாகும். இது இயந்திரம் மற்றும் குரலுக்கு உரை அங்கீகாரத்திற்கு பொருந்தாது, ஏனெனில் சாதனத்தின் விளைவு மற்றும் செயல்களை பாதிக்கும் குறிப்பிட்ட சொற்கள் அல்லது சொற்றொடர்களை அங்கீகரிப்பது கடினம்.

மொத்தத்தில், இந்த இயந்திரங்கள் எவ்வளவு மேம்பட்டதாக இருந்தாலும், AI உதவியாளர்களின் முன்னோக்கி நகரும் வளர்ச்சிக்கு மேற்கூறிய காரணிகள் தொடர்ந்து தடையாக இருக்கும். எவ்வாறாயினும், விஞ்ஞானமும் தொழில்நுட்பமும் வளர்ந்து வரும் வேகம், அனைத்து பெரிய நிறுவனங்களும் உகந்த குரல் அங்கீகார சாதனங்களை உருவாக்குவதில் கவனம் செலுத்துகின்றன, விரைவில் அல்லது பின்னர் அவை மடிப்புகளில் சலவை செய்யப்படும், மேலும் நம் அனைவருக்கும் குரல் இயக்கப்பட்ட ரோபோ இருக்கும், அது எங்கள் வீடுகளை இயக்கும் அத்துடன் நம் வாழ்க்கையும்.

RAF 100 நிகழ்வு மற்றும் STEM என்றால் என்ன என்பதைப் பற்றி மேலும் அறியவும்

எங்கள் பிரத்யேக உள்ளடக்கத்தை அணுக லிங்க்ட்இனில் எங்களைப் பின்தொடர்வதை உறுதிசெய்க! # raf100event #WhatIsSTEM