Trending News

Subscribe Now

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

Article | Creative/Design | Technology

“Hey Google, play some music”

เชื่อว่าสายเทคโนโลยีหลายคนน่าจะได้มีโอกาสลองใช้การส่งคำสั่งด้วยเสียงกันแล้ว ไม่ว่าจะผ่านอุปกรณ์อย่าง Google Home หรือ Amazon Alexa หรือจากมือถืออย่าง Siri ใน iPhone หรือ Google Assistant ใน Android

สิ่งที่นักพัฒนาพยายามทำอยู่ในปัจจุบันคือการพยายามทำให้เจ้าเครื่องเหล่านี้สามารถฟังเสียงของเราได้แม่นยำชัดเจนมากขึ้น แน่นอนว่าบางครั้งเราพูดสำเนียงไม่ดี หรือแม้แต่สั่งขณะที่มีอาหารอยู่ในปาก เจ้าระบบเหล่านี้นอกจากจะต้องพยายามเข้าใจแล้ว ยังต้องเรียนรู้สำเนียง โทนเสียง หรือแม้แต่รูปแบบคำสั่งของเราเพิ่มขึ้นทุกวัน ๆ อีกด้วย

ความพยายามอีกขั้นหนึ่งคือการจดจำน้ำเสียงแน่นอนว่าเสียงของแต่ละคนนั้นไม่เหมือนกัน มนุษย์เราเองสามารถจำเสียงของเพื่อนที่ตะโกนดังมาจากนอกบ้านได้โดยไม่ต้องเห็นตัว ซึ่งการพัฒนาด้าน Voice Recognition นั้น อาจจะพาเราไปสู่ยุคที่ไม่เพียงแต่ใช้เสียงส่งคำสั่งแต่ยังสามารถใช้เสียงปลดล็อคพาสเวิร์ดได้เลย

เพราะถ้าระบบสามารถจำได้ว่านี่คือเสียงของเราแล้ว เราก็สามารถสั่งให้ระบบโอนเงิน ถอนเงินได้ โดยไม่ต้องใส่รหัสผ่าน หรือพาสเวิร์ดใด ๆ

แต่นั่นก็ยังไม่ใช่เรื่องที่ใหม่ซะทีเดียว

ล่าสุด COCHLEAR (http://cochlear.ai) Startup รายหนึ่งของญี่ปุ่นได้คิดระบบที่สามารถฟังเสียงได้มากกว่า voice หรือเสียงพูดได้แล้ว

เสียงอะไรอีก นอกจากเสียงพูด?

เสียงฝนตก เสียงเดินเท้า เสียงนกร้อง

มนุษย์เรามีความสามารถในการฟังเสียงเหล่านี้ แต่ระบบ voice recognition ในปัจจุบันยังไปไม่ถึงจุดนั้น

Yoonchang Han, CEO และ Co-founder ของ Cochlear บอกว่า ในอนาคตพวกเขามีความพยายามอยากให้ระบบสามารถพัฒนาไปให้ถึงการสามารถแยกแยะได้ระหว่างเสียงฝนตกหนัก ฝนตกเบา เสียงเท้าเดิน ที่สามารถรู้ได้ว่า การเดินหนักเช่นนี้ ความถี่แบบนี้ คือการเดินของใคร หรือแม้แต่เสียงร้องของสัตว์ นี่คือเสียงแมว นี่คือเสียงนก และถ้ารู้ว่าเป็นนก ก็ต้องรู้ด้วยว่าเป็นนกพันธุ์อะไร

ดังที่ motto ใหญ่ของบริษัทบอกไว้ว่า “Creating ears for artificial intelligence”

การพัฒนารูปแบบนี้จะนำไปซึ่งความเข้าใจที่มากขึ้น เป็นไปได้ว่าต่อไปเพียงแค่คุณเดินกลับเข้ามาในบ้าน ระบบก็สามารถเปิดแอร์ให้คุณได้เลยโดยไม่ต้องสั่ง หรือถ้าได้ยินเสียงจากหน้าบ้าน เราอาจจะถามระบบได้ว่าเสียงใครมาที่หน้าประตูบ้านเช่นนี้เป็นต้น

แต่การพัฒนาาแบบนี้ยังต้องใช้ระยะเวลาอีกซักพักเลยทีเดียว

ซึ่ง Startup จากญี่ปุ่นรายนี้ ได้ทำการทดลองที่ซับซ้อนขึ้น เช่น ..

ถ้าเรานำเสียงบีบแตรของรถยนต์มา ระบบจะสามารถรู้ได้ว่าเป็นเสียงแตรรถ .. อันนี้ไม่ยาก

แต่ถ้าเรานำเสียงบีบแตรรถ มาบีบให้เป็นจังหวะเสียงดนตรี ถามว่า ระบบจะเข้าใจว่านี่คือเสียงแตรรถหรือเสียงดนตรีกันแน่?

คำตอบคือ มันมองว่านี่คือเสียงดนตรี

ซึ่งก็ถือว่าฉลาดไม่เบาเลยทีเดียว

แต่ตัวอย่างที่ยกมานั้นเป็นเพียงแค่หนึ่งในความซับซ้อน ที่เชื่อว่าบนโลกมนุษย์ที่มีเสียงต่าง ๆ มากมายนั้น ยังคงมีความท้าทายอีกมากให้ค้นหา

พอได้เห็นแบบนี้แล้วก็กลับมานึกถึงหูของมนุษย์เรา ที่สามารถแยกแยะทุกอย่างที่ซับซ้อนได้อย่างสุดยอดเลยจริง ๆ

Related Articles

ใครได้ก็ยิ้ม กับอมยิ้มรูปเหมือน

เอาใจสายหวานกันบ้าง กับ “อมยิ้มรูปเหมือน” อีกหนึ่งไอเดียที่น่ารักมาก จากร้าน Spun ประเทศสหรัฐอเมริกา ที่นี่นอกจากจะเป็นโรงเรียนสอนปั้นอมยิ้ม (แบบทางการมีใบประกาศนียบัตรให้ด้วย) แล้ว ก็ยังเป็นรับทำ อมยิ้มรูปเหมือน โดยมี…

Article | Creative/Design

End of the walk way : มอไซค์ ทำไมไม่มี?

ขณะที่วินมอเตอร์ไซค์ในบ้านเรา มองไปทางไหนก็เจอ ปักหลักรอรับบริการอยู่แทบทุกแยก ทุกซอย เราทุกคนต่างคุ้นเคยในบริการ และความสะดวกที่ได้รับ แต่ทำไมบางเมือง บางประเทศ.. ไม่มีบริการมอเตอร์ไซค์รับจ้างบ้าง ?? หากลองคิดดู…

Article | End of The Walk Way
sit ut odio sed eleifend mattis mattis elit. Praesent venenatis, dolor