Trending News

Subscribe Now

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

Article | Creative/Design | Technology

“Hey Google, play some music”

เชื่อว่าสายเทคโนโลยีหลายคนน่าจะได้มีโอกาสลองใช้การส่งคำสั่งด้วยเสียงกันแล้ว ไม่ว่าจะผ่านอุปกรณ์อย่าง Google Home หรือ Amazon Alexa หรือจากมือถืออย่าง Siri ใน iPhone หรือ Google Assistant ใน Android

สิ่งที่นักพัฒนาพยายามทำอยู่ในปัจจุบันคือการพยายามทำให้เจ้าเครื่องเหล่านี้สามารถฟังเสียงของเราได้แม่นยำชัดเจนมากขึ้น แน่นอนว่าบางครั้งเราพูดสำเนียงไม่ดี หรือแม้แต่สั่งขณะที่มีอาหารอยู่ในปาก เจ้าระบบเหล่านี้นอกจากจะต้องพยายามเข้าใจแล้ว ยังต้องเรียนรู้สำเนียง โทนเสียง หรือแม้แต่รูปแบบคำสั่งของเราเพิ่มขึ้นทุกวัน ๆ อีกด้วย

ความพยายามอีกขั้นหนึ่งคือการจดจำน้ำเสียงแน่นอนว่าเสียงของแต่ละคนนั้นไม่เหมือนกัน มนุษย์เราเองสามารถจำเสียงของเพื่อนที่ตะโกนดังมาจากนอกบ้านได้โดยไม่ต้องเห็นตัว ซึ่งการพัฒนาด้าน Voice Recognition นั้น อาจจะพาเราไปสู่ยุคที่ไม่เพียงแต่ใช้เสียงส่งคำสั่งแต่ยังสามารถใช้เสียงปลดล็อคพาสเวิร์ดได้เลย

เพราะถ้าระบบสามารถจำได้ว่านี่คือเสียงของเราแล้ว เราก็สามารถสั่งให้ระบบโอนเงิน ถอนเงินได้ โดยไม่ต้องใส่รหัสผ่าน หรือพาสเวิร์ดใด ๆ

แต่นั่นก็ยังไม่ใช่เรื่องที่ใหม่ซะทีเดียว

ล่าสุด COCHLEAR (http://cochlear.ai) Startup รายหนึ่งของญี่ปุ่นได้คิดระบบที่สามารถฟังเสียงได้มากกว่า voice หรือเสียงพูดได้แล้ว

เสียงอะไรอีก นอกจากเสียงพูด?

เสียงฝนตก เสียงเดินเท้า เสียงนกร้อง

มนุษย์เรามีความสามารถในการฟังเสียงเหล่านี้ แต่ระบบ voice recognition ในปัจจุบันยังไปไม่ถึงจุดนั้น

Yoonchang Han, CEO และ Co-founder ของ Cochlear บอกว่า ในอนาคตพวกเขามีความพยายามอยากให้ระบบสามารถพัฒนาไปให้ถึงการสามารถแยกแยะได้ระหว่างเสียงฝนตกหนัก ฝนตกเบา เสียงเท้าเดิน ที่สามารถรู้ได้ว่า การเดินหนักเช่นนี้ ความถี่แบบนี้ คือการเดินของใคร หรือแม้แต่เสียงร้องของสัตว์ นี่คือเสียงแมว นี่คือเสียงนก และถ้ารู้ว่าเป็นนก ก็ต้องรู้ด้วยว่าเป็นนกพันธุ์อะไร

ดังที่ motto ใหญ่ของบริษัทบอกไว้ว่า “Creating ears for artificial intelligence”

การพัฒนารูปแบบนี้จะนำไปซึ่งความเข้าใจที่มากขึ้น เป็นไปได้ว่าต่อไปเพียงแค่คุณเดินกลับเข้ามาในบ้าน ระบบก็สามารถเปิดแอร์ให้คุณได้เลยโดยไม่ต้องสั่ง หรือถ้าได้ยินเสียงจากหน้าบ้าน เราอาจจะถามระบบได้ว่าเสียงใครมาที่หน้าประตูบ้านเช่นนี้เป็นต้น

แต่การพัฒนาาแบบนี้ยังต้องใช้ระยะเวลาอีกซักพักเลยทีเดียว

ซึ่ง Startup จากญี่ปุ่นรายนี้ ได้ทำการทดลองที่ซับซ้อนขึ้น เช่น ..

ถ้าเรานำเสียงบีบแตรของรถยนต์มา ระบบจะสามารถรู้ได้ว่าเป็นเสียงแตรรถ .. อันนี้ไม่ยาก

แต่ถ้าเรานำเสียงบีบแตรรถ มาบีบให้เป็นจังหวะเสียงดนตรี ถามว่า ระบบจะเข้าใจว่านี่คือเสียงแตรรถหรือเสียงดนตรีกันแน่?

คำตอบคือ มันมองว่านี่คือเสียงดนตรี

ซึ่งก็ถือว่าฉลาดไม่เบาเลยทีเดียว

แต่ตัวอย่างที่ยกมานั้นเป็นเพียงแค่หนึ่งในความซับซ้อน ที่เชื่อว่าบนโลกมนุษย์ที่มีเสียงต่าง ๆ มากมายนั้น ยังคงมีความท้าทายอีกมากให้ค้นหา

พอได้เห็นแบบนี้แล้วก็กลับมานึกถึงหูของมนุษย์เรา ที่สามารถแยกแยะทุกอย่างที่ซับซ้อนได้อย่างสุดยอดเลยจริง ๆ

Related Articles

Do and Don’t การตลาดในช่วงวิกฤต COVID-19

ช่วงนี้หนักหนาสาหัสกันทุกภาคส่วนนะครับ นักการตลาดเองก็ต้องปรับแผนกันยกใหญ่เพื่อรับมือกับสถานการณ์ปัจจุบัน แต่คำถามคือ ในช่วงเวลาวิกฤตแบบนี้ อะไรควรทำและไม่ควรทำบ้าง เมื่อทุกข้อความที่ถูกสื่อสารออกไปจะมีความละเอียดอ่อนมากขึ้นไปอีกในช่วงเวลาที่ยากลำบากแบบนี้ จากข้อมูลของ Facebook Webinar “Fighting…

Article | Digital marketing

พักสายตาจากออนไลน์สตรีมมิ่ง แล้วหันไปทำสิ่งเหล่านี้ดีกว่า

เมื่อเราลดการเดินทางไปทำงานที่ออฟฟิศ หลายคนวันนี้อยู่บ้านมากขึ้นกว่าเดิม มีเวลามากขึ้น ทั้งนี้แม้ว่าพวกเราจะ Work From Home กัน แต่ช่วงเวลาที่เหลือหลังจาก WFH…

Article

แกะความสำเร็จ Viral Marketing ผ่านคลิป Our Floating Dreams ค่ายดิสนีย์

Viral marketing หรือการตลาดแบบปากต่อปาก เป็นหนึ่งในกลยุทธ์ทางการตลาดที่ได้รับความนิยมสูงในการบอกต่อเพื่อเพิ่มการรับรู้แบรนด์ ผลิตภัณฑ์ หรือบริการ ในสมัยก่อนผู้บริโภคจะบอกกันไปเรื่อย ๆ แบบปากต่อปากเมื่อพบว่าสินค้าชิ้นนั้นคุ้มค่าและได้ผลดีจริง ต่อมา…

Article | Digital marketing
ut Aliquam fringilla Curabitur commodo Lorem neque.