แสดงบทความที่มีป้ายกำกับ gesture recognition แสดงบทความทั้งหมด
แสดงบทความที่มีป้ายกำกับ gesture recognition แสดงบทความทั้งหมด

30 พฤษภาคม 2553

Gesture Recognition - เทคโนโลยีตรวจจับภาษากาย (ตอนที่ 4)


นักวิจัยทั่วโลก กำลังพยายามที่จะทำให้ถุงมืออันตรกริยา (Interactive Data Glove) มีราคาถูกลง ด้วยการค้นหาแนวทางใหม่ๆ ในการสร้างถุงมือ คณะวิจัยของผมได้เสนอเซ็นเซอร์ที่ใช้ในถุงมือ ที่ผลิตได้ด้วยวิธีการพิมพ์ ซึ่งจะทำให้สามารถผลิตเซ็นเซอร์ได้ถูกมาก รวมไปถึงการใช้เครือข่ายไร้สายที่เรียกว่า Zigbee ซึ่งมีราคาไม่แพง ในการส่งข้อมูลระหว่างถุงมือกับคอมพิวเตอร์

ที่ MIT เขาก็มีการพัฒนาถุงมืออันตรกริยาเหมือนกัน และล่าสุดเขาก็ได้ออกมาเปิดเผยผลงานที่สร้างความฮือฮามาก เพราะถุงมือของเขามีสีสันฉูดฉาดเหมือนถุงมือตัวตลก แถมยังไม่มีเซ็นเซอร์ในการตรวจวัดบนถุงมือใดๆ ทั้งนี้ คณะวิจัยได้ใช้กล้อง web cam ที่ใช้กันทั่วไปเพื่อตรวจจับอากัปกริยาของมือ โดยกล้องจะจับภาพมือและโปรแกรมวิเคราะห์ภาพจะทำการประมวลผล ว่ามือกำลังทำอะไรอยู่

แนวทางในการตรวจจับอาการของมือแบบนี้ ใช้เทคโนโลยีที่เรียกว่า Machine Vision คือการแปลผลจากภาพวีดิโอที่ถ่ายได้ ซึ่งก่อนหน้านี้มีคนพยายามใช้วิธีนี้กันมาก แต่ก็มักจะพบกับอุปสรรค เพราะการแปลความหมายของมือจากภาพวีดิโอยังไม่ง่ายนัก ที่ทำกันก็โดยการเอาเทปสี ไปแปะไว้ที่ถุงมือบริเวณปลายนิ้ว เพื่อให้มีความแตกต่าง (Contrast) ของสีมากๆ โปรแกรมประมวลผลภาพจะได้สามารถแยกแยะนิ้วบนมือได้ วิธีการจึงตรวจวัดอาการของนิ้วมือได้ใน 2 มิติเท่านั้น และก็ตรวจอากัปกริยายากๆ ไม่ได้ด้วย

ถุงมือตัวตลกของ MIT ซึ่งเป็นส่วนหนึ่งของวิทยานิพนธ์ระดับปริญญาโทของ นาย โรเบิร์ต หวัง (Robert Wang) นี้ออกแบบมาอย่างชาญฉลาดมากครับ เพราะตัวถุงมือมีลักษณะเป็นจิ๊กซอว์หลากสีมาต่อกัน โดยใช้สีทั้งหมด 10 สี มีลำดับการต่อกันระหว่างจิ๊กซอว์เหล่านั้นอย่างแน่นอน ทำให้โปรแกรมประมวลผลภาพ สามารถแยกถุงมือ ออกจากสิ่งแวดล้อมได้ง่าย และที่สำคัญ มันสามารถจำแนกอาการของมือได้แบบ 3 มิติเลย โดยการคำนวณจากรูปร่างของจิ๊กซอว์สีที่เปลี่ยนไปตามอาการของมือ (สังเกตว่า จิ๊กซอว์มีรูปร่างขยุกขยัก ซึ่งเกิดจากการออกแบบมา และทดสอบมาแล้วว่าได้ผลดี) คณะวิจัยที่ MIT ได้สาธิตให้ดูว่าถุงมือตัวตลกนี้สามารถใช้ในการทำงานกับ โปรแกรมพวก CAD/CAM (โปรแกรมออกแบบ ทางด้านอุตสาหกรรม) แทนเมาส์ได้ โดยเราใช้มือจับนู่นจับนี้ หมุนของ เลื่อนสิ่งของที่อยู่ในจอภาพ โดยที่ผู้ใช้จะรู้สึกเหมือนมือของตนได้เข้าไปอยู่ในคอมพิวเตอร์จริงๆ ....


28 พฤษภาคม 2553

Gesture Recognition - เทคโนโลยีตรวจจับภาษากาย (ตอนที่ 3)


ก็อย่างที่ผมเคยพูดไปก่อนหน้านี้แหล่ะครับว่า เราจะเริ่มเห็นการหลอมรวม หรือเข้ามาบรรจบกัน ระหว่างจักรกลที่มนุษย์สร้างขึ้นกับตัวมนุษย์เอง (Life and Machine Integration) โดยศาสตร์แห่งการเชื่อมโยงระหว่างมนุษย์กับจักรกล (Human Machine Inteface หรือ Human Computer Interface) ก็เป็นสาขาหนึ่งที่จะเป็นจุดเริ่มในการทำให้จักรกลมีความเป็นชีวิต หรือ มีความเป็นมนุษย์ขึ้นมา หรือแม้กระทั่งอาจทำให้มนุษย์มีความเป็นจักรกลขึ้นมาด้วยก็ได้

ถุงมืออันตรกริยา (Interactive Data Glove) ก็เป็นเทคโนโลยีหนึ่งในการตรวจจับภาษากาย ที่มีผู้สนใจศึกษาวิจัยกันมาก เพราะเหตุที่ว่า แม้คนที่ไม่ได้เป็นใบ้ และพูดได้เป็นปกติ ก็มักชอบใช้กริยาท่าทางของมือและแขน เพื่อแสดงออกในการช่วยอธิบายสิ่งต่างๆ ให้ผู้อื่นเข้าใจ การอ่านหรือตรวจจับอากัปกริยาเท่านั้นทำได้หลายวิธีครับ แต่วิธีหนึ่งที่มีผู้สนใจศึกษากันมาก ก็โดยการอาศัยถุงมือนี่แหล่ะครับ ในการถ่ายทอดอาการของมือไปยังคอมพิวเตอร์ นับตั้งแต่ภาพยนตร์ของ Steven Spielberg เรื่อง Minority Report ออกฉายในปี ค.ศ. 2002 ซึ่งในหนังเรื่องนี้ ทอม ครูซ ได้โชว์การใช้ถุงมืออันตรกริยา ในการหยิบจับสิ่งต่างๆ รูปภาพ วีดิโอ ข้อมูล จัดเรียงไปมาบนจอโปรเจคเตอร์ที่ลอยอยู่ในอากาศ นักวิจัยและพัฒนาทั่วโลกต่างได้รับแรงบันดาลใจนี้ และพยายามแข่งขันกันเพื่อพัฒนาถุงมืออันตรกริยา ซึ่งปัจจุบันถุงมืออันตรกริยามีจำหน่ายแล้ว แต่ราคาสูงมาก มีตั้งแต่ราคาประมาณ 50,000 บาท ขึ้นไปจนถึงราคาเป็นล้านบาท

เมื่อเป็นอย่างนี้ จึงมีคนพยายามจะพัฒนาเทคโนโลยีที่จะทำให้ถุงมืออันตรกริยามีราคาที่ถูกลง ในกลุ่มวิจัยของผมเองก็ได้ทำวิจัยเรื่องนี้ครับ โดยนักศึกษาปริญญาโทท่านหนึ่งชื่อ คุณนัษฐพงษ์ ทองรอด ได้ค้นคว้าและพัฒนาถุงมืออันตรกริยาที่ใช้เซ็นเซอร์ที่ผลิตได้จากวิธีการพิมพ์หมึกนำไฟฟ้า ลงบนแผ่นรองที่สามารถนำไปเย็บติดกับถุงมือ โดยร่วมมือกับ คุณณัฐพล วัฒนวิสุทธิ์ ซึ่งเป็นลูกน้องของ ดร. อดิสร เตือนตรานนท์แห่ง NECTEC ในการทำให้ถุงมือนี้สามารถคุยกันเป็นเครือข่ายไร้สาย โดยถุงมืออันตรกริยานี้สามารถถ่ายทอดอากัปกริยาของมือมายังคอมพิวเตอร์ ซึ่งคณะวิจัยได้พัฒนาโปรแกรมคอมพิวเตอร์ให้สามารถนำอาการของมือ ไปควบคุมโปรแกรมในคอมพิวเตอร์ได้ ถุงมือดังกล่าวจะมีประโยชน์มากสำหรับโครงการวิจัยสภาพล้อมรอบอัจฉริยะ (Smart Environment) ที่เรากำลังวิจัยอยู่ครับ

ว่างๆ มาคุยเรื่องนี้กันต่อนะครับ .....

21 กุมภาพันธ์ 2553

Gesture Recognition - เทคโนโลยีตรวจจับภาษากาย (ตอนที่ 2)



งานวิจัยทางด้าน Gesture Recognition นั้นมีกว้างขวางครับ ผมจะค่อยๆ นำประเด็นต่างๆ ที่นักวิจัยกำลังสนใจศึกษากัน มาเล่าให้ฟังเป็นตอนๆ ครับ วันนี้ขอพูดในเรื่องของเทคโนโลยีการสื่อสารผ่านภาษามือ


การตรวจจับภาษามือ เพื่อให้คอมพิวเตอร์เข้าใจความหมายของภาษามือ ซึ่งประโยชน์ของมันก็คือ การช่วยในการติดต่อสื่อสารกับผู้พิการทางด้านการได้ยิน ซึ่งเทคโนโลยีนี้จะช่วยแปลความหมายจากภาษามือจากผู้พิการเหล่านั้น มาให้คนอย่างเราเข้าใจได้ง่าย เมื่อเราอยากจะคุยกับเขา เราอาจจะพูดหรือพิมพ์ เพื่อให้คอมพิวเตอร์แปลเป็นภาษามือ แล้วแสดงผลออกจอคอมพิวเตอร์ หรือ อาจผ่านทางหุ่นยนต์มือ ที่สามารถแสดงลักษณะท่าทางของภาษามือได้


การตรวจจับอาการของมือ หรือ Hand Tracking นั้น ยังมีประโยชน์อีกมากมายครับ เราอาจจะใช้อาการของมือ เพื่อทำการติดต่อกับคอมพิวเตอร์ เรียกว่าเป็น User Interface แบบหนึ่ง ท่านผู้อ่านอาจจะจำภาพยนตร์เรื่อง Minority Report ได้ ตอนที่ทอม ครุยส์ ทำการค้นหาไฟล์ต่างๆ ในคอมพิวเตอร์ ด้วยการใส่ถุงมือ แล้วลากมือไปมา หยิบไอ้นั่นไอ้นี่ โดยใช้มือขยุมๆ แล้วก็สะบัดเอาไฟล์ออกมาเรียง รูดไปรูดมา ดึงไฟล์ ซูมภาพ โดยการขยับนิ้วต่างๆ

เท่าที่ผมศึกษาข้อมูลมา การตรวจจับภาษามือจะทำกันมากใน 2 วิธี คือ การตรวจจับด้วยภาพวิดีโอ (Machine Vision) กับ การใช้ถุงมืออันตรกริยา (Interactive Data Glove) โดยผมก็กำลังทำวิจัยในเรื่องของ Interactive Data Glove อยู่ด้วยครับ โดยเราพัฒนาถุงมืออันตรกริยาขึ้นมาเองในประเทศไทย เนื่องจากถุงมืออันตรกริยามีราคาแพงมาก มีตั้งแต่ราคาหลักหมื่น ไปจนถึงหลักล้าน โดยกลุ่มวิจัยของศูนย์นาโนเทคโนโลยี มหาวิทยาลัยมหิดล ได้พัฒนาเซ็นเซอร์ตรวจจับการเคลื่อนไหวของนิ้วและมือ จากถุงมือ ซึ่งจะส่งข้อมูลผ่านเครือข่ายไร้สายมาที่คอมพิวเตอร์ ซึ่งเราได้พัฒนาซอฟต์แวร์เพื่อแปลความหมายของมือ

แล้วมาคุยเรื่องนี้กันต่อนะครับ ....

13 กุมภาพันธ์ 2553

Gesture Recognition - เทคโนโลยีตรวจจับภาษากาย (ตอนที่ 1)



ศาสตร์แห่งการบูรณาการระหว่างสิ่งมีชีวิต กับจักรกล (Life and Machine Integration) กำลังเป็นเรื่องที่มาแรงมากๆ ในช่วงไม่กี่ปีมานี้ครับ สาขาหนึ่งที่ผมจะนำมากล่าวถึงในบทความชุดนี้ก็คือ HMI (Human-Machine Interface) หรือการเชื่อมต่อระหว่างมนุษย์กับจักรกล ซึ่งมีสาขาย่อยๆ ออกไปมากมาย เช่น Bionics (อวัยวะชีวกล) Implantable System (การปลูกอุปกรณ์เข้าไปในร่างกายมนุษย์) Smart Fabrics (อาภรณ์ฉลาด) และอื่นๆ อีกมากมายครับ

แต่วันนี้ผมขอนำศาสตร์ในการเชื่อมโยงระหว่างมนุษย์ กับ จักรกล ซึ่งจะทำให้การเชื่อมต่อในเรื่องของการแสดงออกทางภาษากาย หรือ อากัปกริยา ระหว่างมนุษย์กับจักรกลเกิดขึ้นได้ ศาตร์นั้นก็คือ Gesture Recognition ซึ่งเป็นเรื่องของการตรวจวัดและแปลความหมายของภาษาร่างกายของคนเรา ให้ออกมาเป็นโมเดลทางคณิตศาสตร์ที่สามารถนำไปใช้งานต่อได้ เป็นการเปลี่ยนอาการทางกายของมนุษย์ให้เป็นข้อมูลดิจิตอลที่มีความหมาย สามารถนำไปอ้างอิง เปรียบเทียบ และ ประมวลผลเชิงตัวเลขได้

ภาษากายของมนุษย์นี้ก็จะรวมถึง อะไรก็ได้ที่แสดงออกได้ทางร่างกายครับ เช่น กริยา อาการ ท่าทาง การแสดงออกทางสีหน้า การยักคิ้วหลิ่วตา การกรอกตาไปมา การแสดงอาการเซ็ง เสียใจ ซึ้งใจ ภาษามือต่างๆ ก็รวมอยู่ด้วย การยักไหล่ ลักษณะการเดิน นั่ง วิ่ง นอน รวมหมดเลยครับ ทั้งนี้ยังรวมไปถึงการวิเคราะห์การเคลื่อนไหวของกายเหล่านั้นทีละส่วน หรือ หลายๆ ส่วนพร้อมกัน หรือเป็นองค์รวม

การพัฒนาเทคโนโลยีตรวจจับภาษากายนี้ มีประโยชน์ต่อทั้งมนุษย์และจักรกลครับ เพราะว่าจะทำให้มนุษย์มีช่องทางในการติดต่อ (Interface) ใช้ประโยชน์จากจักรกลมากขึ้น ซึงปัจจุบันเราสื่อสารกับจักรกลผ่านอุปกรณ์เชื่อมต่อไม่กี่อย่าง เช่น คีย์บอร์ด เมาส์ ทัชแพด ตอนนี้มีอุปกรณ์ Haptics มาให้ใช้เพิ่มขึ้น แต่ต่อไปเครื่องจักรจะเข้าใจภาษากายของเราด้วยครับ ส่วนประโยชน์ที่จักรกลจะได้รับก็คือ "ความมีชีวิต" เพราะอาการทางกายเป็นสิ่งที่ส่งมีชีวิตระดับสูงมี ดังนั้น ถ้าอยากให้จักรกลมีลักษณะของชีวิต ก็ต้องทำให้มันมีภาษากายด้วยครับ

วันหลังมาคุยกันต่อครับ ......