Trending News

Subscribe Now

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

Article | Creative/Design | Technology

“Hey Google, play some music”

เชื่อว่าสายเทคโนโลยีหลายคนน่าจะได้มีโอกาสลองใช้การส่งคำสั่งด้วยเสียงกันแล้ว ไม่ว่าจะผ่านอุปกรณ์อย่าง Google Home หรือ Amazon Alexa หรือจากมือถืออย่าง Siri ใน iPhone หรือ Google Assistant ใน Android

สิ่งที่นักพัฒนาพยายามทำอยู่ในปัจจุบันคือการพยายามทำให้เจ้าเครื่องเหล่านี้สามารถฟังเสียงของเราได้แม่นยำชัดเจนมากขึ้น แน่นอนว่าบางครั้งเราพูดสำเนียงไม่ดี หรือแม้แต่สั่งขณะที่มีอาหารอยู่ในปาก เจ้าระบบเหล่านี้นอกจากจะต้องพยายามเข้าใจแล้ว ยังต้องเรียนรู้สำเนียง โทนเสียง หรือแม้แต่รูปแบบคำสั่งของเราเพิ่มขึ้นทุกวัน ๆ อีกด้วย

ความพยายามอีกขั้นหนึ่งคือการจดจำน้ำเสียงแน่นอนว่าเสียงของแต่ละคนนั้นไม่เหมือนกัน มนุษย์เราเองสามารถจำเสียงของเพื่อนที่ตะโกนดังมาจากนอกบ้านได้โดยไม่ต้องเห็นตัว ซึ่งการพัฒนาด้าน Voice Recognition นั้น อาจจะพาเราไปสู่ยุคที่ไม่เพียงแต่ใช้เสียงส่งคำสั่งแต่ยังสามารถใช้เสียงปลดล็อคพาสเวิร์ดได้เลย

เพราะถ้าระบบสามารถจำได้ว่านี่คือเสียงของเราแล้ว เราก็สามารถสั่งให้ระบบโอนเงิน ถอนเงินได้ โดยไม่ต้องใส่รหัสผ่าน หรือพาสเวิร์ดใด ๆ

แต่นั่นก็ยังไม่ใช่เรื่องที่ใหม่ซะทีเดียว

ล่าสุด COCHLEAR (http://cochlear.ai) Startup รายหนึ่งของญี่ปุ่นได้คิดระบบที่สามารถฟังเสียงได้มากกว่า voice หรือเสียงพูดได้แล้ว

เสียงอะไรอีก นอกจากเสียงพูด?

เสียงฝนตก เสียงเดินเท้า เสียงนกร้อง

มนุษย์เรามีความสามารถในการฟังเสียงเหล่านี้ แต่ระบบ voice recognition ในปัจจุบันยังไปไม่ถึงจุดนั้น

Yoonchang Han, CEO และ Co-founder ของ Cochlear บอกว่า ในอนาคตพวกเขามีความพยายามอยากให้ระบบสามารถพัฒนาไปให้ถึงการสามารถแยกแยะได้ระหว่างเสียงฝนตกหนัก ฝนตกเบา เสียงเท้าเดิน ที่สามารถรู้ได้ว่า การเดินหนักเช่นนี้ ความถี่แบบนี้ คือการเดินของใคร หรือแม้แต่เสียงร้องของสัตว์ นี่คือเสียงแมว นี่คือเสียงนก และถ้ารู้ว่าเป็นนก ก็ต้องรู้ด้วยว่าเป็นนกพันธุ์อะไร

ดังที่ motto ใหญ่ของบริษัทบอกไว้ว่า “Creating ears for artificial intelligence”

การพัฒนารูปแบบนี้จะนำไปซึ่งความเข้าใจที่มากขึ้น เป็นไปได้ว่าต่อไปเพียงแค่คุณเดินกลับเข้ามาในบ้าน ระบบก็สามารถเปิดแอร์ให้คุณได้เลยโดยไม่ต้องสั่ง หรือถ้าได้ยินเสียงจากหน้าบ้าน เราอาจจะถามระบบได้ว่าเสียงใครมาที่หน้าประตูบ้านเช่นนี้เป็นต้น

แต่การพัฒนาาแบบนี้ยังต้องใช้ระยะเวลาอีกซักพักเลยทีเดียว

ซึ่ง Startup จากญี่ปุ่นรายนี้ ได้ทำการทดลองที่ซับซ้อนขึ้น เช่น ..

ถ้าเรานำเสียงบีบแตรของรถยนต์มา ระบบจะสามารถรู้ได้ว่าเป็นเสียงแตรรถ .. อันนี้ไม่ยาก

แต่ถ้าเรานำเสียงบีบแตรรถ มาบีบให้เป็นจังหวะเสียงดนตรี ถามว่า ระบบจะเข้าใจว่านี่คือเสียงแตรรถหรือเสียงดนตรีกันแน่?

คำตอบคือ มันมองว่านี่คือเสียงดนตรี

ซึ่งก็ถือว่าฉลาดไม่เบาเลยทีเดียว

แต่ตัวอย่างที่ยกมานั้นเป็นเพียงแค่หนึ่งในความซับซ้อน ที่เชื่อว่าบนโลกมนุษย์ที่มีเสียงต่าง ๆ มากมายนั้น ยังคงมีความท้าทายอีกมากให้ค้นหา

พอได้เห็นแบบนี้แล้วก็กลับมานึกถึงหูของมนุษย์เรา ที่สามารถแยกแยะทุกอย่างที่ซับซ้อนได้อย่างสุดยอดเลยจริง ๆ

Related Articles

ST.NOIRE บอร์ดเกม AI ที่ชวนผู้เล่นสืบคดีฆาตกรรมปริศนาโดยลำโพง Alexa

“เพราะคำตอบมีเพียงหนึ่งเดียว และคนร้ายนั้นก็คือ……” สำหรับคนที่ชอบอ่านหนังสือหรือดูหนังแนวสืบสวนสอบสวน ต้องคุ้นหูกับประโยคนี้เป็นแน่ ฟังแล้วจิตวิญญาณโคนันพุ่งเข้าสิงทันที ที่เกริ่นขึ้นมาแบบนี้เพราะเราจะพูดถึงเรื่องฆาตกรรม คนร้าย การสืบสวนซึ่งไม่ใช่หนังสือหรือภาพยนตร์แต่อย่างใด แต่มันคือบอร์ดเกม และไม่ใช่บอร์ดเกมธรรมดา…

Article | Technology

การกลับมาของ Drive-In Theater โรงหนังกลางแจ้งที่รักษาระยะห่างระหว่างชมภาพยนตร์

แล้วชีวิตของทุกคนก็เปลี่ยนแปลงไปอีกครั้ง เมื่อโรคระบาดลุกลามไปทั่วโลก คุกคามความเป็นอยู่ของเราจนต้องปรับทั้งวิถีการทำงาน การกิน และการอยู่ภายในเวลาอันรวดเร็ว อีกทั้งยังไม่มีใครคาดการณ์ได้ว่าสถานการณ์นี้จะจบลงอย่างไร แต่มนุษยชาติไม่เคยแล้งความคิดสร้างสรรค์ โจทย์ใหญ่อย่างการเว้นช่องว่างทางสังคม (Social Distancing)…

Article

Hero Arm เทคโนโลยี 3D Printing เปลี่ยนความพิการให้กลายเป็นพลังพิเศษ!

ผลงานอันฉลาดล้ำจาก Open Bionics ที่นำเอาเทคโนโลยี 3D Printing มาสร้างอวัยวะเพื่อช่วยเหลือผู้พิการในรูปแบบของแขนเทียม โดยแต่ละนิ้วจะเชื่อมต่อกับระบบประสาท ทำให้สารมารถขยับ หยิบจับสิ่งของต่าง ๆ ได้อย่างมหัศจรรย์…

Article | Technology
quis Aliquam risus. facilisis consectetur ipsum massa ut Sed pulvinar tristique