Trending News

Subscribe Now

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

Article | Creative/Design | Technology

“Hey Google, play some music”

เชื่อว่าสายเทคโนโลยีหลายคนน่าจะได้มีโอกาสลองใช้การส่งคำสั่งด้วยเสียงกันแล้ว ไม่ว่าจะผ่านอุปกรณ์อย่าง Google Home หรือ Amazon Alexa หรือจากมือถืออย่าง Siri ใน iPhone หรือ Google Assistant ใน Android

สิ่งที่นักพัฒนาพยายามทำอยู่ในปัจจุบันคือการพยายามทำให้เจ้าเครื่องเหล่านี้สามารถฟังเสียงของเราได้แม่นยำชัดเจนมากขึ้น แน่นอนว่าบางครั้งเราพูดสำเนียงไม่ดี หรือแม้แต่สั่งขณะที่มีอาหารอยู่ในปาก เจ้าระบบเหล่านี้นอกจากจะต้องพยายามเข้าใจแล้ว ยังต้องเรียนรู้สำเนียง โทนเสียง หรือแม้แต่รูปแบบคำสั่งของเราเพิ่มขึ้นทุกวัน ๆ อีกด้วย

ความพยายามอีกขั้นหนึ่งคือการจดจำน้ำเสียงแน่นอนว่าเสียงของแต่ละคนนั้นไม่เหมือนกัน มนุษย์เราเองสามารถจำเสียงของเพื่อนที่ตะโกนดังมาจากนอกบ้านได้โดยไม่ต้องเห็นตัว ซึ่งการพัฒนาด้าน Voice Recognition นั้น อาจจะพาเราไปสู่ยุคที่ไม่เพียงแต่ใช้เสียงส่งคำสั่งแต่ยังสามารถใช้เสียงปลดล็อคพาสเวิร์ดได้เลย

เพราะถ้าระบบสามารถจำได้ว่านี่คือเสียงของเราแล้ว เราก็สามารถสั่งให้ระบบโอนเงิน ถอนเงินได้ โดยไม่ต้องใส่รหัสผ่าน หรือพาสเวิร์ดใด ๆ

แต่นั่นก็ยังไม่ใช่เรื่องที่ใหม่ซะทีเดียว

ล่าสุด COCHLEAR (http://cochlear.ai) Startup รายหนึ่งของญี่ปุ่นได้คิดระบบที่สามารถฟังเสียงได้มากกว่า voice หรือเสียงพูดได้แล้ว

เสียงอะไรอีก นอกจากเสียงพูด?

เสียงฝนตก เสียงเดินเท้า เสียงนกร้อง

มนุษย์เรามีความสามารถในการฟังเสียงเหล่านี้ แต่ระบบ voice recognition ในปัจจุบันยังไปไม่ถึงจุดนั้น

Yoonchang Han, CEO และ Co-founder ของ Cochlear บอกว่า ในอนาคตพวกเขามีความพยายามอยากให้ระบบสามารถพัฒนาไปให้ถึงการสามารถแยกแยะได้ระหว่างเสียงฝนตกหนัก ฝนตกเบา เสียงเท้าเดิน ที่สามารถรู้ได้ว่า การเดินหนักเช่นนี้ ความถี่แบบนี้ คือการเดินของใคร หรือแม้แต่เสียงร้องของสัตว์ นี่คือเสียงแมว นี่คือเสียงนก และถ้ารู้ว่าเป็นนก ก็ต้องรู้ด้วยว่าเป็นนกพันธุ์อะไร

ดังที่ motto ใหญ่ของบริษัทบอกไว้ว่า “Creating ears for artificial intelligence”

การพัฒนารูปแบบนี้จะนำไปซึ่งความเข้าใจที่มากขึ้น เป็นไปได้ว่าต่อไปเพียงแค่คุณเดินกลับเข้ามาในบ้าน ระบบก็สามารถเปิดแอร์ให้คุณได้เลยโดยไม่ต้องสั่ง หรือถ้าได้ยินเสียงจากหน้าบ้าน เราอาจจะถามระบบได้ว่าเสียงใครมาที่หน้าประตูบ้านเช่นนี้เป็นต้น

แต่การพัฒนาาแบบนี้ยังต้องใช้ระยะเวลาอีกซักพักเลยทีเดียว

ซึ่ง Startup จากญี่ปุ่นรายนี้ ได้ทำการทดลองที่ซับซ้อนขึ้น เช่น ..

ถ้าเรานำเสียงบีบแตรของรถยนต์มา ระบบจะสามารถรู้ได้ว่าเป็นเสียงแตรรถ .. อันนี้ไม่ยาก

แต่ถ้าเรานำเสียงบีบแตรรถ มาบีบให้เป็นจังหวะเสียงดนตรี ถามว่า ระบบจะเข้าใจว่านี่คือเสียงแตรรถหรือเสียงดนตรีกันแน่?

คำตอบคือ มันมองว่านี่คือเสียงดนตรี

ซึ่งก็ถือว่าฉลาดไม่เบาเลยทีเดียว

แต่ตัวอย่างที่ยกมานั้นเป็นเพียงแค่หนึ่งในความซับซ้อน ที่เชื่อว่าบนโลกมนุษย์ที่มีเสียงต่าง ๆ มากมายนั้น ยังคงมีความท้าทายอีกมากให้ค้นหา

พอได้เห็นแบบนี้แล้วก็กลับมานึกถึงหูของมนุษย์เรา ที่สามารถแยกแยะทุกอย่างที่ซับซ้อนได้อย่างสุดยอดเลยจริง ๆ

Related Articles

Big History Project กับการเรียนรู้ประวัติศาสตร์โลก ที่สนุกที่สุด!

สนุกกับประวัติศาสตร์โลกไปกับ Big History Project วันนี้จะมาแนะนำเว็บไซต์ที่จะทำให้เรื่องน่าเบื่อ ๆ อย่างประวัติศาสต์โลกนั้นกลายเป็นเรื่องสนุกอย่าง BIG HISTORY PROJECT (school.bighistoryproject.com/bhplive)…

Article | Technology

ทีมพร้อม เครื่องมือพร้อม ใช้ชีวิต Work From Home อย่างประสิทธิภาพรับสถานการณ์ COVID-19

จากสถานการณ์ COVID-19 ในเมืองไทยที่ตอนนี้ เปลี่ยนไปอย่างข้างรวดเร็วและน่าเป็นห่วง เมื่อตัวเลขผู้ติดเชื้อยังเพิ่มขึ้นเรื่อยๆ ถึงแม้ในสถานที่ทำงานทุกคนได้รับการอบรมวิธีการป้องกันตัวเองอย่างดี รวมถึงมีการดูแลเรื่องความสะอาดในออฟฟิศอย่างถูกวิธีและสม่ำเสมอ แต่เราปฏิเสธไม่ได้ว่ามีปัจจัยภายนอกอย่างการเดินทางที่กระทบกับสุขภาพทั้งกายและใจของพนักงาน ทำให้องค์กรหลายแห่งต้องเริ่มปรับรูปแบบการทำงาน ออกนโยบาย Work…

Article | Creative/Design

โลกนี้เขาใช้ Big Data เพื่อเปลี่ยนกลยุทธ์ทางธุรกิจได้อย่างไร

วันนี้เราจะมาคุยในเรื่องของ Data ที่หลายคนกำลังพูดถึงและให้ความสำคัญ ผมมีโอกาสได้ไปบรรยายเกี่ยวกับเรื่อง Data ว่ามีผลกับการทำการตลาดอย่างไร หรือสามารถใช้ Data เพื่อทำการตลาดให้ดีขึ้นได้อย่างไรที่ AIS…

Digital marketing | Morning Call | Podcast
risus eleifend Curabitur leo id, lectus felis sem, at elit. quis,