
ปัญญาประดิษฐ์
คำอธิบายประกอบข้อความและสื่อหลายภาษา
เนื่องจากในการทำงานร่วมกันแต่ละครั้งจะทำให้ระบบสามารถทดสอบ ตรวจสอบและเรียนรู้ได้ ระบบปัญญาประดิษฐ์จึงมีความชาญฉลาดขึ้นในทุกครั้งที่มีการประมวลข้อมูล เรามองเห็นวิวัฒนาการดังกล่าวเฉกเช่นเดียวกับองค์กรของเรา ด้วยเหตุนี้ เราจึงมีเป้าหมายอันชัดเจนในการพัฒนาสำหรับการเรียนรู้เครื่องมือและวิทยาศาสตร์ข้อมูล
ทางลัดไปยังรายละเอียดคำอธิบายประกอบข้อความและสื่อ
คำอธิบายประกอบข้อความและสื่อ
ส่วนย่อยของ Machine Learning & Data Analysis Engineering

บทนำ
คำอธิบายประกอบข้อความและสื่อหรือการติดฉลากข้อมูลเป็นขั้นตอนในการติดฉลากส่วนประกอบแต่ละส่วนของข้อมูลการฝึกฝน (ไม่ว่าจะเป็นข้อความ วิดีโอหรือรูปภาพ) เพื่อให้คอมพิวเตอร์สามารถเข้าใจได้ว่ามีอะไรอยู่ในข้อความนั้นบ้าง ข้อมูลที่มีคำอธิบายนี้จะถูกนำไปใช้ในการฝึกฝนแม่แบบ
ข้อมูลที่มีคำอธิบายประกอบเป็นส่วนสำคัญของโมเดลการเรียนรู้ภายใต้การดูแล เนื่องจากประสิทธิภาพและความถูกต้องของแบบจำลองดังกล่าวนั้นขึ้นอยู่กับคุณภาพและปริมาณของข้อมูลที่มีคำอธิบายประกอบ ข้อมูลที่มีคำอธิบายประกอบมีความสำคัญด้วยเหตุผลดังต่อไปนี้:
- รูปแบบการเรียนรู้ของคอมพิวเตอร์มีการใช้งานที่สำคัญที่แตกต่างกันไป
- การค้นหาข้อมูลที่มีคำอธิบายประกอบคุณภาพสูงเป็นหนึ่งในความท้าทายหลักในการสร้างแบบจำลองสำหรับการเรียนรู้ของคอมพิวเตอร์
รายละเอียดของคำอธิบายประกอบ
คำอธิบายประกอบข้อความ

Text Annotation คือการอธิบายต่อท้ายให้แก่เนื้อหาต้นฉบับตามเกณฑ์แบบต่าง ๆ ทั้งนี้ ขึ้นอยู่กับข้อกำหนดและความต้องการของลูกค้า คำอธิบายประกอบของข้อความประกอบด้วยองค์ประกอบที่หลากหลาย เช่น ความรู้สึก เจตนา ความหมาย ตัวตน หรือความสัมพันธ์
ความเชื่อมั่น
คำอธิบายประกอบความเชื่อมั่นเป็นการแสดงถึงอารมณ์และโทนความรู้สึกจากข้อความโดยการบ่งบอกว่าข้อความนั้นเป็นไปในเชิงบวก ลบหรือเป็นกลาง
เจตนา
คำอธิบายประกอบเจตนาเป็นการแสดงออกถึงควมต้องการของเนื้อหาและการจัดประเภท เช่น คำสั่ง คำขอ การยืนยัน เป็นต้น
ความหมาย
คำอธิบายความหมายแสดงถึงข้อความที่อ้างอิงถึงแนวคิดและตัวตน เช่น ผู้คน สถานที่หรือวัตถุ
ความสัมพันธ์
คำอธิบายความสัมพันธืแสดงถึงความสัมพันธืระหว่างเนื้อหาในส่วนต่าง ๆ หน้าที่ประกอบด้วยการพึ่งพาและการแก้ปัญหาร่วมกัน
องค์กรส่วนใหญ่มองหาผู้ใส่คำอธิบายที่เป็นมนุษย์เพื่อแบ่งข้อมูลเนื้อหา คำอธิบายข้อความโดยมนุษย์นั้นมีประโยชน์อย่างยิ่งในการวิเคราะห์ข้อมูลความรู้สึก เนื่องจากส่วนนี้ จะต้องมีการปรับให้เหมาะสมยิ่งขึ้นและยังขึ้นอยู่กับแนวโน้มคำแสลงและการใช้ภาษาอื่น ๆ ในปัจจุบันอีกด้วย ในส่วนของเอกสารต้นฉบับ REEID GCE ยอมรับเนื้อหาที่มีโครงสร้างและไม่มีโครงสร้างหรือแม้แต่ไฟล์ต้นฉบับที่ต้องทำ OCR
ตัวอย่างธุรกิจที่มีการแปล
การดูแลสุขภาพ
Text data Annotation มีบทบาทสำคัญในอุตสาหกรรมการดูแลสุขภาพ โดยเฉพาะในปัจจุบันเมื่อเราต้องทำงานที่เกี่ยวข้องกับบริการที่ต้องใช้ปัญญาประดิษฐ์ในธุรกิจทางการแพทย์ อาทิเช่น การบริหารจัดการทะเบียนผู้ป่วย แชทบอทด้านการแพทย์ ฯลฯ
ในกรณีดังกล่าว เราไม่สามารถปล่อยให้เกิดความเสี่ยงด้านความไม่ถูกต้องของข้อมูล เนื่องจากมีชีวิตของผู้ป่วยเข้ามาเกี่ยวข้อง
ต่อไปนี้คือการ้งานของ text annotation ที่มีบทบาทสำคัญ
Entity Annotation สำหรับการดึงรายละเอียดในรายงานทางการแพทย์ เช่น ข้อมูลตัวเลข อาทิ ระดับความดันโลหิต ฮีโมโกลบิน เป็นต้น
- Entity Annotation สำหรับคำอธิบายในส่วนของยา ปริมาณ เวลาในการใช้ยา ฯลฯ จากใบสั่งยาที่แพทย์กำหนด
- Intent Annotation และ linguistics annotation สำหรับการค้นคว้าวิจัยและการศึกษาซึ่งจะเป็นคำอธิบายรายละเอียดและสำระสำคัญของบริบท ทำให้สามารถอ่านดูเนื้อหาในปริมาณมากได้ง่ายขึ้น
- Sentiment Annotation เพื่อจุดประสงค์ในการดูผลในโรงพยาบาล ห้องปฏิบัติการหรือการใช้งานด้านการดูแลสุขภาพ
- Intent Annotation, Linguistics Annotation, และ Semantic Annotation เพื่อการบริการลูกค้าในด้านการดูแลสุขภาพและแชทบอท
การขนส่ง
ในขณะที่อุตสาหกรรมการขนส่งและซัพพลายเชนกำลังเติบโตขึ้นอย่างรวดเร็ว รวมทั้งการใช้เทคโนโลยีเพื่อการขนส่งก็เช่นเดียวกัน ตั้งแต่การเรียกเก็บเงินและการติดฉลากใบกำกับสินค้าไปจนถึงผู้ช่วยเสมือนนั้นมีข้อมูลที่ถูกสร้างขึ้นทุกวันเป็นจำนวนมาก
Customer Care Virtual Assistant ตรวจจับโดยการระบุหน่วยเฉพาะจากข้อความของผู้ใช้
เมื่อลูกค้าเข้ามาสอบถามราคา ผู้ช่วยเสมือนจะถามคำถามสองสามข้อและแจ้งอัตราราคาโดยทันที ข้อมูลของบริษัทและข้อมูลอื่นที่เป็นประโยชน์จะถูกแยกออกจากการโต้ตอบ โดยจะมีการนำไปประมวลเพิ่มเติมและแจ้งอัตราคา
นอกจากนี้ ธุรกิจโลจิสติกส์ยังใช้ Data Annotation ในลักษณะดังต่อไปนี้:
- Entity annotation สำหรับอำอธิบายชื่อ จำนวน เลขที่คำสั่งซื้อ รายการ ฯลฯ จากใบกำกับสินค้าและใบเรียกเก็บเงิน
- Sentiment and Entity Annotation สำหรับคำติชมจากลูกค้า
การธนาคาร
ในปัจจุบัน การธนาคารมีการใช้ที่หลากหลาย เราใช้การธนาคารออนไลน์ซึ่งรวมไปถึงการปฏิสัมพันธ์กับแอพลิเคชันและเว็บไซต์เพื่อทำธุรกรรมและบริการอื่น ๆ จากธนาคาร
การใช้งานบางส่วนสำหรับการแยกข้อมูลมีดังนี้
- การจัดประเภทข้อความช่วยให้ลูกค้าคาดการณ์ได้
- Intent, sentiment, และ linguistic annotation นั้นใช้เพื่อบริการลูกค้าและแชทบอท
- Entity Annotation ใช้เพื่อแยกรายการ เช่น ชื่อ จำนวน เลขที่บัญชีธนาคาร จากแบบฟอร์มประเภทต่าง ๆ
รัฐบาล
การใช้ annotation ในหน่วยงานของรัฐ นั้นคล้ายคลึงกับการธนาคารแต่มีขอบเขตในการใช้งานที่กว้างมากกว่ หน่วยงานของรัฐประกอบด้วยฝ่ายการศึกษา การค้นคว้าวิจัย อาหารและยา กฎหมาย ฝ่ายภาษี สื่อ เป็นต้น
การใช้ annotation ในส่วนนี้มีดังต่อไปนี้
- Intent, entity, และ linguistic annotation สำหรับภาคธุรกิจที่ได้กล่าวมาทั้งหมดเพื่อการบริการลูกค้า แชทบอทและผู้ช่วยเสมือน
- การจัดประเภทข้อความสำหรับจัดหมวดหมู่คดีอาญา แพ่ง ฯลฯ ตามเนื้อหาของคดี
- Linguistic Annotation สำหรับสำนักงานตำรวจและอาชญากรรมเพื่อการตรวจจับน้ำเสียง ความหมายและคดีและรายงานทางอาญาและอื่น ๆ
- Entity Annotation สำหรับเอกสารราชการทั้งหมดที่มีคำอธิบายรายการ เช่น ชื่อ แผนก ตำแหน่งและบริบทสำคัญ
สื่อและข่าวสาร
สื่อและข่าวสารคืออีกหนึ่งภาคส่วนที่มีเนื้อหาข้อความเป็นจำนวนมากซึ่งสามารถใช้ Annotation ได้หลากหลายเพื่อทำความเข้าใจในเนื้อหา
Data Annotation ในสื่อและข่าวสารต่าง ๆ นั้นมีการใช้ในกรณีดังต่อไปนี้:
- Entity annotation สำหรับคำธิบายประกอบรายการต่าง ๆ เช่น ชื่อ ตำแหน่ง บริบทสำคัญ ตัวเลข ฯลฯ จากบทความต่าง ๆ
- Text Classification เพื่อการจัดประเภทเนื้อหาลงในหมวดหมู่ต่าง ๆ เพื่อข่าวสาร เช่น กีฬา การศึกษา รัฐบาล ข่าวในประเทศ ข่างต่งประเทศ การบันเทิง
- Linguistic Annotation และ Semantic Annotation สำหรับคำอธิบายประกอบสัทศาสตร์ ความหมาย และวาทกรรมสำหรับบทความและรายงานข่าว
- นอกเหนือจากการใช้งานตามที่ได้อธิบายไปข้างต้นแล้ว ยังมีสาขาย่อยอีกมากมาย เช่น การวิจัย การศึกษา การบันเทิง อีคอมเมิร์ซ มัลติมีเดีย เป็นต้น
IMAGE ANNOTATION

Image Annotation คือกระบวนการในการแยกประเภทภาพจากส่วนต่าง ๆ เพื่อสอนโมเดล AI หรือ MLตัวอย่างเช่น โมเดลการเรียนรู้เครื่องจักรจะมีระดับการเรียนรู้ในระดับที่ดี (เหมือนกับมนุษย์) โดยมีรูปภาพดิจิตัลพร้อมแท็กและสามารถเข้าใจรูปภาพที่มองเห็นได้ โดยขึ้นอยู่กับกรณีการใช้งาน หมายเลขฉลากในรูปภาพอาจแตกต่างกันออกไป image annotation พื้นฐานมีอยู่ไม่กี่ประเภทดังต่อไปนี้
Image Classification
ในขั้นต้น เครื่องจะได้รับการฝึกด้วยรูปภาพที่มีคำอธิบายประกอบ จากนั้นจึงกำหนดว่าจะแสดงรูปภาพใดด้วยรูปภาพที่มีคำอธิบายประกอบที่กำหนดไว้ล่วงหน้า
Object Recognition/Detection
รูปแบบการจัดประเภทภาพเพิ่มเติม ซึ่งเป็นการกำหนดลักษณะที่ถูกต้องของตัวเลขและตำแหน่งเฉพาะของรายการในภาพ ในขณะเดียวกัน จะกำหนดประเภทรูปภาพรวมในการจัดประเภทรูปภาพ การจดจำวัตถุจะเป็นการจัดประเภทรายการโดยแยกต่างหาก ตัวอย่างเช่น เมื่อมีภาพ ภาพจะถูกจัดประเภทว่าเป็นชายหาดหรือป่า การจดจำวัตถุแต่ละรายการจะแท็กรายการต่างๆ ในรูปภาพ เช่น คน สัตว์ หรือรถยนต์
Segmentation
รูปแบบของคำอธิบายประกอบรูปภาพขั้นสูงเพื่อให้สามารถแปลภาพได้ง่ายขึ้น โดยจะแยกภาพออกเป็นส่วน ๆ และส่วนต่างๆ เหล่านี้จะเรียกว่าวัตถุภาพ การแบ่งส่วนภาพมีสามประเภท:
- Semantic segmentation: จัดประเภทวัตถุที่คล้ายกันตามคุณสมบัติ เช่น ขนาดและตำแหน่ง
- Instance segmentation: สาารถแยกประเภทแต่ละรายการในภาพได้ กำหนดคุณสมบัติของรายการ เช่น ตำแหน่งและจำนวน
- Panoptic segmentation: ทั้งสองแบบมีการใช้โดยใช้รวมกัน
VIDEO ANNOTATION

Video annotation คือกระบวนการในการแท็กหรือจัดประเภทคลิปวีดิโอ เพื่อเป็นการเตรียมชุดข้อมูลสำหรับการฝึกโมเดลการเรียนรู้ของคอมพิวเตอร์ (training machine learning ) และการเรียนรู้เชิงลึก (deep learning) โครงข่ายประสาทเทียมขั้นสูงเหล่านี้จึงถูกนำมาใช้สำหรับแอพลิเคชันการมองเห็นของคอมพิวเตอร์ เช่น เครื่องมือการจัดประเภทวิดีโอแบบอัตโนมัติ ซึ่งจะช่วยในการตรวจจับและจำแนกวัตถุในวิดีโอด้วยความแม่นยำแบบเฟรมต่อเฟรม . การจดจำวัตถุผ่านการมองเห็น computer vision video annotation นั้นคล้ายกับimage annotation นั่นคือ คุณสามารถใช้กล่องขอบเขต การแบ่งส่วนความหมาย โพลีไลน์ ฯลฯ คุณอาจรู้มาว่าหน้าที่ที่เกี่ยวข้องกับ video annotation นั้นใช้เพื่อตรวจจับวัตถุเคลื่อนไหวในวิดีโอและทำให้สามารถตรวจจับได้ภายในการเอ๊าท์ไลน์แบบ frame-to-frame เพื่อให้สามารถฝึกฝนโมเดลอัจฉริยะสมองกลได้
ประเภทของ Video Annotation
เป็นเรื่องจำเป็นที่คุณจะต้องรู้ประเภทของเทคนิค Video Annotation จะทำให้เรามีความเข้าใจข้อกำหนดในการใส่คำอธิบายประกอบได้
2D Marking
ในประเภทนี้ จะใช้บ็อกซ์เพื่อแสดงวัตถุในวิดีโอ Annotator สร้างบ็อซ์ตามขอบเขตของวัตถุ
3D Marking
วิธีการนี้จะใช้บ็อซ์ 3 มิติซึ่งจะทำให้โมเดลอัจฉริยะสมองกลตรวจวัดวัตถุทั้งสามมิติได้อย่างแม่นยำรวมทั้งประสานกับวัตถุที่อยู่โดยรอบ
Polygon Labelling
เมื่อวัตถุที่ต้องการมีรูปร่างที่ไม่ปกติ จะต้องใช้ polygon labeling ซึ่งถือเป็นวิธีการที่แม่นยำที่สุด
Landmarks / Keypoints
Keypoint labeling คือการใส่พ๊อยท์ไปยังวัตถุ วิธีนี้มีประสิทธิภาพในการจับภาพการเคลื่อนไหวของการแสดงอารมณ์ทางใบหน้า ส่วนของร่างกาย ยานพาหนะ เครื่องมือ และวัตถุโครงกระดูกที่เคลื่อนไหวอื่นๆ
Lines & Splines
หนึ่งในจุดประสงค์หลักของ Lines & Splines คือการกำหนดเลนและขอบเขตของพื้นที่ที่นิยมใช้ในระบบยานพาหนะอัตโนมัติ
มาตรการรักษาความปลอดภัยของข้อมูล
เรามอบการดูแลข้อมูลให้แก่ลูกค้าและของเราเอง เราตระหนักดีว่าเอกสารและข้อมูลบางอย่างของลูกค้าจะต้องไม่ถูกปิดเผยต่อบุคคลที่ไม่ได้รับอนุญาตและ/หรือโรบ็อตใด ๆ ด้านล่างนี้คือการควบคุมด้านความปลอดภัยและวิธีการที่เราได้นำมาปฏิบัติใช้ภายในหน่วยธุรกิจของเรา
- เราเลือกที่จะไม่ใช้บริการการจัดเก็บข้อมูลบนคลาวด์ (Google, Dropbox เป็นต้น) สำหรับข้อมูลที่มีความอ่อนไหว
- เราไม่ใช้ Statistical Machine Translation Engine จากบุคคลที่สามยกเว้นในกรณีที่ลูกค้าต้องการเท่านั้น
- เราไม่สร้าง ฝึกฝนและใช้ระบบการเรียนรู้ผ่านเครื่องจักรและประมวลชุดข้อมูลโดยการใช้เครื่องมือจากบุคคลที่สามซึ่งจัดเก็บไว้บนคลาวด์ ยกเว้นในกรณีที่ลูกค้าต้องการเท่านั้น
- สำหรับการสื่อสารภายนอก เราใช้โปรโตคอลในการส่งข้อมูลผ่าน HTTP และ SSH เท่านั้น
- การเข้ารหัสไฟล์ที่แข็งแกร่งภายในที่จัดเก็บในตัวเครื่องและ Distributed DMS
- การเข้าถึงแพลตฟอร์มออนไลน์ของเราที่มีการตั้งค่าไว้อย่างละเอียดรอบคอบ (โปรไฟล์ บทบาท กฎในการแบ่งปัน)
- มีการควบคุมการเข้าถึงระดับบันทึกฐานข้อมูล
- การตรวจสอบสิทธิ์ MFA สำหรับการเข้าถึงข้อมูลที่สำคัญทั้งหมด
- มีขั้นตอนการทำลายและกำจัดข้อมูล
- ระบบป้องกันการบุกรุก
- ระบบและขั้นตอนการป้องกันการสูญหายของข้อมูลหลายชั้น (DLP)
- ขั้นตอนการปกปิดตัวตน (เป็นเรื่องสำคัญในกรณีที่ใช้บุคลากรจากภายนอก)
- การตรวจสอบความปลอดภัยและการรักษาความลับอยู่ตลอดเวลา
- ดาต้า เซ็นเตอร์ในยุโรปและเอเชีย (ขึ้นอยู่กับข้อกำหนดด้านความปลอดภัยของข้อมูล จะมีการเลือกดาต้า เซ็นเตอร์เฉพาะ)
- การปฏิบัติตาม GDPR อย่างเต็มรูปแบบ
- การปฏิบัติตามข้อกำหนดด้านการปกป้องข้อมูลตามข้อบังคับของประเทศนอกเขตยุโรป