เปิดชุดข้อมูล

ค้นพบชุดข้อมูลโอเพ่นซอร์สที่ให้คุณฝึกโมเดล ML

ชุดข้อมูลโอเพนซอร์สเพื่อให้คุณเริ่มต้นใช้งานโมเดล AI/ML

ผลลัพธ์ของโมเดล AI & ML ของคุณนั้นดีพอๆ กับข้อมูลที่คุณใช้ในการฝึกเท่านั้น ดังนั้นความแม่นยำที่คุณใช้กับการรวมข้อมูลและการติดแท็กและการระบุข้อมูลนั้นเป็นสิ่งสำคัญ!

ดังนั้น หากคุณต้องการเริ่มต้นความคิดริเริ่ม AI/ML ใหม่และตอนนี้ คุณตระหนักได้อย่างรวดเร็วว่าการค้นหาข้อมูลการฝึกอบรมคุณภาพสูงจะเป็นหนึ่งในแง่มุมที่ท้าทายมากขึ้นของโครงการของคุณ เนื่องจากชุดข้อมูลคุณภาพสูงเป็นเชื้อเพลิงที่ช่วยให้ AI/ เครื่องยนต์ ML ทำงาน เราได้รวบรวมรายการชุดข้อมูลแบบเปิดที่ใช้งานได้ฟรีและฝึกโมเดล AI/ML ของคุณในอนาคต

ความเชี่ยวชาญ	ประเภทข้อมูล	ชื่อชุดข้อมูล	อุตสาหกรรม / ฝ่าย	คำอธิบายประกอบ/กรณีการใช้งาน	รายละเอียด	ลิงค์
NLP	ข้อความ	รีวิว Amazon	E-Commerce	การวิเคราะห์ความเชื่อมั่น	ชุดบทวิจารณ์และการให้คะแนน 35 ล้านรายการในช่วง 18 ปีที่ผ่านมาในรูปแบบข้อความธรรมดาพร้อมรายละเอียดผู้ใช้และผลิตภัณฑ์	ลิงค์
NLP	ข้อความ	Wikipedia ลิงก์ข้อมูล	General		มากกว่า 4 ล้าน บทความที่มี 1.9 พันล้าน คำที่ประกอบด้วยคำและวลีตลอดจนย่อหน้า	ลิงค์
NLP	ข้อความ	สแตนด์ฟอร์ด เซนติเมนท์ ทรีแบงค์	ความบันเทิง	การวิเคราะห์ความเชื่อมั่น	ชุดข้อมูลคำอธิบายประกอบความคิดเห็นสำหรับบทวิจารณ์กว่า 10,000 ชิ้นจาก Rotten Tomatoes ในรูปแบบไฟล์ HTML	ลิงค์
NLP	ข้อความ	Twitter ความเชื่อมั่นของสายการบินสหรัฐฯ	สายการบิน	การวิเคราะห์ความเชื่อมั่น	2015 ทวีตบน US Airlines แยกออกเป็นโทนบวก ลบ และเป็นกลาง	ลิงค์
CV	ภาพ	ติดป้ายกำกับ Faces In The Wild	General	การจดจำใบหน้า	ชุดข้อมูลที่มีใบหน้าที่ครอบตัดกว่า 13,000 ใบหน้าพร้อมรูปภาพสองภาพที่แตกต่างกันสำหรับการฝึกจดจำใบหน้า	ลิงค์
CV	วิดีโอ, รูปภาพ	ชุดข้อมูล UMDFaces	General	การจดจำใบหน้า	ชุดข้อมูลที่มีคำอธิบายประกอบที่มีใบหน้ามากกว่า 367,000 ใบหน้าจากกว่า 8,000 หัวข้อที่รวมภาพนิ่งและวิดีโอ	ลิงค์
CV	ภาพ	อิมเมจเน็ต	General		ชุดข้อมูลที่มีมากกว่า 14 ล้าน รูปภาพในรูปแบบไฟล์ต่างๆ จัดระเบียบตามลำดับชั้นของ WordNet	ลิงค์
CV	ภาพ	รูปภาพเปิดของ Google	General		9 น. URL สำหรับจัดหมวดหมู่ภาพสาธารณะจากกว่า 6,000 หมวดหมู่	ลิงค์
NLP	ข้อความ	MIMIC Critical Care ฐานข้อมูล	การดูแลสุขภาพ		ชุดข้อมูลสรีรวิทยาเชิงคำนวณพร้อมข้อมูลที่ไม่ระบุตัวตนจากผู้ป่วยวิกฤต 40,000 ราย ชุดข้อมูลประกอบด้วยข้อมูล เช่น ข้อมูลประชากร สัญญาณชีพ ยารักษาโรค ฯลฯ	ลิงค์
CV	ภาพ	สำนักงานการท่องเที่ยวและการท่องเที่ยวแห่งชาติสหรัฐอเมริกา	การท่องเที่ยว		ให้ภาพถ่ายกว้างๆ จากอุตสาหกรรมการท่องเที่ยวพร้อมฐานข้อมูลที่น่าเชื่อถือ ครอบคลุมหัวข้อต่างๆ เช่น การเดินทางขาเข้าและขาออก และข้อมูลการท่องเที่ยวระหว่างประเทศ	ลิงค์
NLP	ข้อความ	กรมการขนส่ง	การท่องเที่ยว		ชุดข้อมูลการท่องเที่ยวที่รวมอุทยานแห่งชาติ ทะเบียนผู้ขับขี่ สะพาน ข้อมูลรถไฟ ฯลฯ	ลิงค์
NLP	เสียง	คลังคำบรรยายเสียง Flickr	General		คำอธิบายภาพมากกว่า 40 คำบรรยายจากภาพถ่าย 8,000 ภาพที่ออกแบบมาสำหรับรูปแบบคำพูดที่ไม่มีผู้ดูแล	ลิงค์
NLP	เสียง	ชุดข้อมูลคำสั่งเสียง	General	การรู้จำเสียง คำบรรยายเสียง	คำพูดยาว 1 วินาทีจากบุคคลนับพัน เพื่อสร้างอินเทอร์เฟซเสียงพื้นฐาน	ลิงค์
NLP	เสียง	ชุดข้อมูลเสียงสิ่งแวดล้อม	General		สภาพแวดล้อมชุดข้อมูลเสียงที่มีเสียงของตารางเหตุการณ์และตารางฉากอะคูสติก	ลิงค์
NLP	ข้อความ	ชุดข้อมูลการวิจัยแบบเปิดของ COVID-19	การดูแลสุขภาพ	AI ทางการแพทย์	ชุดข้อมูลการวิจัยประกอบด้วยบทความวิชาการ 45,000 บทความเกี่ยวกับ COVID-19 และกลุ่มไวรัส coronavirus	ลิงค์
CV	ภาพ	Waymo เปิดชุดข้อมูล	ยานยนต์		ชุดข้อมูลการขับขี่อัตโนมัติที่หลากหลายที่สุดที่เผยแพร่โดย Waymo	ลิงค์
CV	ภาพ	จีโนมภาพ	General	คำบรรยายภาพ	ฐานความรู้ด้านภาพพร้อมคำอธิบายภาพโดยละเอียดกว่า 100 ภาพ	ลิงค์
CV	ภาพ	ป้ายชื่อ	ภาครัฐ		ชุดรูปภาพที่มีคำอธิบายประกอบขนาดใหญ่เข้าถึงได้ผ่าน Labelme Matlab	ลิงค์
CV	ภาพ	ขดลวด100	General		วัตถุต่างๆ กว่า 100 ชิ้นที่ถ่ายภาพจากหลายมุม (เช่น 360 องศา)	ลิงค์
CV	ภาพ	ชุดข้อมูล Stanford Dogs	General		รูปภาพมากกว่า 20,500+ ภาพที่จัดอยู่ในชุดรูปภาพของสุนัขต่าง ๆ 120 สายพันธุ์	ลิงค์
CV	ภาพ	การจดจำฉากในร่ม	General	การจดจำฉาก	ชุดข้อมูลเฉพาะที่ประกอบด้วย 15620 ภาพจาก 67 หมวดหมู่ในร่มเพื่อสร้างแบบจำลองการจดจำฉาก	ลิงค์
CV	ภาพ	VisualQA	General		ชุดข้อมูลที่มีคำถามปลายเปิดที่เกี่ยวข้องกับภาพถ่าย 265,016 รูปที่ต้องใช้ความเข้าใจในการมองเห็นและความเข้าใจในภาษาเพื่อตอบ	ลิงค์
NLP	ข้อความ	ชุดข้อมูลการวิเคราะห์ความเชื่อมั่นแบบหลายโดเมน	E-Commerce	การวิเคราะห์ความเชื่อมั่น	ชุดข้อมูลที่มีการรีวิวสินค้าจาก Amazon	ลิงค์
NLP	ข้อความ	IMDB ความคิดเห็น	ความบันเทิง	การวิเคราะห์ความเชื่อมั่น	ชุดข้อมูลที่มีบทวิจารณ์ภาพยนตร์ 25000 เรื่องสำหรับการวิเคราะห์ความเชื่อมั่น	ลิงค์
NLP	ข้อความ	ความรู้สึก140	General	การวิเคราะห์ความเชื่อมั่น	ชุดข้อมูลที่มี 160,000 ทวีตพร้อมอีโมติคอนที่นำออกล่วงหน้าเพื่อความแม่นยำที่สูงขึ้น	ลิงค์
NLP	ข้อความ	บล็อกเกอร์คอร์ปัส	General	การวิเคราะห์คีย์เวิร์ด	ชุดข้อมูลที่มี 681,288 บล็อกโพสต์จาก blogger.com ซึ่งประกอบด้วยคำภาษาอังกฤษที่ใช้กันอย่างแพร่หลายอย่างน้อย 200 ครั้ง	ลิงค์
NLP	ข้อความ	อันตราย	General	การฝึกอบรม Chatbot	ชุดข้อมูลที่มีคำถามมากกว่า 200,000 ข้อที่สามารถนำมาใช้ฝึกโมเดลการเรียนรู้ของเครื่องให้ตอบสนองอัตโนมัติได้อย่างชาญฉลาด	ลิงค์
NLP	ข้อความ	SMS Spam Collection เป็นภาษาอังกฤษ	เทเลคอม	การจดจำสแปม	ชุดข้อมูลข้อความสแปมประกอบด้วย SMS ภาษาอังกฤษ 5,574 รายการ	ลิงค์
NLP	ข้อความ	Yelp ความคิดเห็น	General	การวิเคราะห์ความเชื่อมั่น	ชุดข้อมูลที่มีบทวิจารณ์มากกว่า 5 ล้านรายการที่เผยแพร่โดย Yelp	ลิงค์
NLP	ข้อความ	สแปมเบสของ UCI	Enterprise	การจดจำสแปม	ชุดข้อมูลอีเมลขยะขนาดใหญ่ มีประโยชน์สำหรับการกรองสแปม	ลิงค์
CV	วิดีโอ, รูปภาพ	เบิร์กลีย์ ดีพไดรฟ์ BDD100k	ยานยนต์	ยานพาหนะอิสระ	ชุดข้อมูลที่ใหญ่ที่สุดชุดหนึ่งสำหรับ AI ที่ขับเคลื่อนด้วยตนเองซึ่งมีประสบการณ์การขับขี่ 1,100 ชั่วโมงในวิดีโอมากกว่า 100,000 รายการจากช่วงเวลาต่างๆ ของวันจากพื้นที่นิวยอร์กและซานฟรานซิสโก	ลิงค์
CV	วีดีโอ	จุลภาค.ai	ยานยนต์	ยานพาหนะอิสระ	ชุดข้อมูลการขับขี่บนทางหลวง 7 ชั่วโมง ประกอบด้วยข้อมูลความเร็ว ความเร่ง มุมบังคับเลี้ยว และพิกัด GPS ของรถ	ลิงค์
CV	วิดีโอ, รูปภาพ	ชุดข้อมูลทิวทัศน์เมือง	ยานยนต์	ฉลากความหมายสำหรับรถยนต์ขับเคลื่อนอัตโนมัติ	ชุดข้อมูลคำอธิบายประกอบระดับ 5,000 พิกเซลพร้อมชุดเฟรมที่ใส่คำอธิบายประกอบไม่แน่นหนา 20,000 เฟรมในลำดับวิดีโอสเตอริโอที่บันทึกจาก 50 เมืองที่แตกต่างกัน	ลิงค์
CV	ภาพ	ชุดข้อมูลป้ายจราจร KUL เบลเยียม	ยานยนต์	ยานพาหนะอิสระ	คำอธิบายประกอบเครื่องหมายจราจรมากกว่า 10000 รายการจากภูมิภาคแฟลนเดอร์ส โดยอิงจากสัญญาณจราจรที่แตกต่างกันตามร่างกายจากทั่วเบลเยียม	ลิงค์
CV	ภาพ	LISA: ห้องปฏิบัติการสำหรับรถยนต์อัจฉริยะและปลอดภัย UC San Diego Datasets	ยานยนต์	ยานพาหนะอิสระ	ชุดข้อมูลที่สมบูรณ์ซึ่งประกอบด้วยป้ายจราจร การตรวจจับยานพาหนะ สัญญาณไฟจราจร และรูปแบบวิถี	ลิงค์
CV	ภาพ	ซิฟาร์ -10	General	การจดจำวัตถุObject	ชุดข้อมูลประกอบด้วยภาพ 50,000 ภาพและภาพทดสอบ 10,000 ภาพ (เช่น ภาพสี 60,000 32×32 ใน 10 คลาส) สำหรับการจดจำวัตถุ	ลิงค์
CV	ภาพ	แฟชั่น MNIST	ร้านแฟชั่นเกาหลี		ชุดข้อมูลรูปภาพที่ประกอบด้วยตัวอย่าง 60,000 ตัวอย่างและชุดทดสอบ 10,000 ตัวอย่างในรูปภาพระดับสีเทา 28×28 ที่เชื่อมโยงกับป้ายกำกับจาก 10 คลาส	ลิงค์
CV	ภาพ	IMDB-ชุดข้อมูล Wiki	ความบันเทิง	การจดจำใบหน้า	ชุดข้อมูลรูปภาพใบหน้าขนาดใหญ่พร้อมป้ายกำกับ เช่น เพศและอายุ จากภาพใบหน้าทั้งหมด 523,051 ภาพ ได้ภาพ 460,723 ภาพจากดาราดัง 20,284 คนจาก IMDB และ 62,328 จาก Wikipedia	ลิงค์
CV	วีดีโอ	จลนศาสตร์-700	General		สำหรับคลาสแอคชั่นแต่ละคลาส ชุดข้อมูลคุณภาพสูงประกอบด้วยคลิปวิดีโอ 650,000 คลิป และรวมคลาสแอคชั่นของมนุษย์ 700 คลาสที่มีคลิปวิดีโออย่างน้อย 600 คลิป ที่นี่แต่ละคลิปมีความยาว 10 วินาทีหรือมากกว่านั้น	ลิงค์
CV	ภาพ	เอ็มเอส โคโค่	General	การตรวจจับวัตถุ การแบ่งส่วน	ชุดข้อมูลประกอบด้วยรูปภาพ 328k และมีอินสแตนซ์ทั้งหมด 2.5 ล้านรายการและรูปภาพออบเจ็กต์ 91 รูปเพื่อฝึกการตรวจจับวัตถุขนาดใหญ่ การแบ่งส่วน และแบบจำลอง ML ที่เกี่ยวข้องกับคำอธิบายข้อมูล	ลิงค์
CV	ภาพ	ชุดข้อมูล MPII Human Pose	General		ภาพถ่ายประมาณ 25K ที่มีบุคคลมากกว่า 40K ที่มีข้อต่อของร่างกายที่มีคำอธิบายประกอบรวมอยู่ในชุดข้อมูล ซึ่งใช้สำหรับการประเมินท่าทางของมนุษย์อย่างชัดเจน โดยรวมแล้ว ชุดข้อมูลครอบคลุมกิจกรรมของมนุษย์ 410 รายการ และแต่ละภาพมีป้ายกำกับกิจกรรม	ลิงค์
CV	ภาพ	เปิดรูปภาพ	General	คำอธิบายประกอบตำแหน่งออบเจ็กต์	ชุดข้อมูลรูปภาพที่มีรูปภาพประมาณ 9 Mn ที่มีป้ายกำกับระดับรูปภาพ กล่องล้อมรอบออบเจ็กต์ การแบ่งส่วนออบเจ็กต์ ฯลฯ ชุดข้อมูลยังประกอบด้วย 16 Mn bounding box สำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.9 Mn	ลิงค์
CV	วีดีโอ	Apollo Open Platform โดย Baidu Inc ประเทศจีน	ยานยนต์	บาวน์ดิ้ง บ็อกซ์, LiDAR	ชุดข้อมูลการขับขี่อัตโนมัติที่สมบูรณ์ ซึ่งให้ข้อมูลที่จำเป็นแก่นักพัฒนาในการขับขี่อัตโนมัติเพื่อเร่งประสิทธิภาพของการทำซ้ำที่เป็นนวัตกรรมใหม่	ลิงค์
CV	วิดีโอ, รูปภาพ	Argo โดย Argo สหรัฐอเมริกา	ยานยนต์	Bounding Box, Optical Flow, ป้ายพฤติกรรม, ป้ายความหมาย, Lane Marking	ชุดข้อมูลการขับขี่อัตโนมัติที่ประกอบด้วยแผนที่ HD ที่มีข้อมูลเมตาทางเรขาคณิตและความหมาย เช่น เส้นกึ่งกลางเลน ทิศทางของเลน และพื้นที่ที่สามารถขับได้ ชุดข้อมูลนี้ใช้เพื่อฝึกโมเดล ML เพื่อสร้างอัลกอริธึมการรับรู้ที่แม่นยำยิ่งขึ้น ซึ่งจะช่วยให้ยานพาหนะที่ขับด้วยตนเองสามารถนำทางได้อย่างปลอดภัย	ลิงค์
CV	วีดีโอ	สัญญาณไฟจราจรขนาดเล็กของ Bosch โดย Bosch North America Research	ยานยนต์	กล่องผูก	ชุดข้อมูลที่ประกอบด้วยภาพจากกล้อง 13427 ภาพที่มีความละเอียด 1280*720 เพื่อสร้างระบบตรวจจับสัญญาณไฟจราจรตามวิสัยทัศน์ ชุดข้อมูลนี้มีสัญญาณไฟจราจรที่มีคำอธิบายประกอบมากกว่า 24000 รายการ	ลิงค์
CV	วีดีโอ	Brain4Cars โดย Cornell Univ. สหรัฐอเมริกา	ยานยนต์	ป้ายพฤติกรรม	ชุดข้อมูลที่ประกอบด้วยอาร์เรย์ของเซ็นเซอร์ในห้องโดยสาร (กล้อง เซ็นเซอร์สัมผัส อุปกรณ์อัจฉริยะ ฯลฯ) เพื่อดึงข้อมูลสถิติที่เป็นประโยชน์เกี่ยวกับการเตรียมพร้อมของคนขับ อัลกอริธึมของเราอาจตรวจจับคนขับที่ง่วงหรือฟุ้งซ่าน และเพิ่มสัญญาณเตือนที่จำเป็นเพื่อปรับปรุงการป้องกัน	ลิงค์
CV	ภาพ	CULane โดยมหาวิทยาลัยจีน ของฮ่องกง ปักกิ่ง ประเทศจีน	ยานยนต์	เครื่องหมายเลน	ชุดข้อมูล Computer Vision เกี่ยวกับการตรวจจับช่องจราจร ซึ่งประกอบด้วยวิดีโอ 55 ชั่วโมง โดยได้แยกเฟรม 133,235 (88880 ชุดการฝึก ชุดตรวจสอบ 9675 ชุด และชุดทดสอบ 34680 ชุด) มันถูกรวบรวมโดยกล้องที่ติดตั้งบนยานพาหนะหกคันที่แตกต่างกันซึ่งขับเคลื่อนโดยคนขับที่แตกต่างกันในปักกิ่ง	ลิงค์
CV	วีดีโอ	เดวิส โดย ม. ของ Zurich,ETH ¨ Zurich, Germany, Switzerland	ยานยนต์		ชุดข้อมูลการฝึกขับรถแบบ end-to-end ที่ใช้กล้อง DAVIS event+frame ข้อมูลรถยนต์ เช่น การบังคับเลี้ยว คันเร่ง GPS ฯลฯ ใช้เพื่อประเมินการรวมเฟรมและข้อมูลเหตุการณ์สำหรับแอปยานยนต์	ลิงค์
CV	วีดีโอ	DBNet โดยมหาวิทยาลัย Shanghai Jiao Tong มหาวิทยาลัยเซียะเหมิน ประเทศจีน	ยานยนต์	พอยต์คลาวด์, LiDAR	ข้อมูลการขับขี่ระยะทาง 1000 กม. ในโลกแห่งความเป็นจริง ซึ่งรวมถึงวิดีโอที่สอดคล้อง จุดคลาวด์ GPS และพฤติกรรมของผู้ขับขี่สำหรับการวิจัยเชิงลึกเกี่ยวกับพฤติกรรมการขับขี่	ลิงค์
CV	วีดีโอ	Dr(eye)ve โดย ม. แห่งโมเดนาและเรจจิโอ เอมิเลีย เมืองโมเดนา ประเทศอิตาลี	ยานยนต์	ป้ายพฤติกรรม	ชุดข้อมูลที่มีลำดับวิดีโอ 74 รายการ แต่ละรายการละ 5 นาที ซึ่งมีคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลประกอบด้วยตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ หลักสูตร และยังติดป้ายกำกับการเพ่งสายตาของผู้ขับขี่และการผสานรวมชั่วคราวเพื่อมอบแผนที่เฉพาะงาน	ลิงค์
CV	วีดีโอ	คนเดินเท้า ETH (2009) โดย ETH ซูริก ซูริก สวิตเซอร์แลนด์	General	กล่องผูก	ชุดข้อมูลวิดีโอ 74 ลำดับ วิดีโอละ 5 นาที พร้อมคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลนี้ระบุตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ ทิศทาง และยังระบุการตรึงสายตาสำหรับผู้ขับขี่และการรวมเวลา รวมถึงแผนที่เฉพาะงาน	ลิงค์
CV	วีดีโอ	ฟอร์ด (2009) โดย ม. มิชิแกน มิชิแกน สหรัฐอเมริกา	ยานยนต์	ขอบเขตกล่อง, , LiDAR	ชุดข้อมูลที่รวบรวมโดยยานพาหนะทางบกแบบอัตโนมัติติดอาวุธด้วยเครื่องสแกน Velodyne 3D-lidar, Rieg lidars ที่มองไปข้างหน้าแบบกดไม้กวาดสองตัว, หน่วยวัดแรงเฉื่อยทางเทคนิคและสำหรับผู้บริโภค (IMU) และระบบกล้องรอบทิศทาง Point Grey Ladybug3	ลิงค์
CV	วีดีโอ	HCI Challenger Stereo, Bosch Corporation Research, Hildesheim, Germany	General		ชุดข้อมูลหลายล้านเฟรมจากฉากวิดีโอที่ถ่ายไว้ ซึ่งรวมถึงสภาพอากาศที่หลากหลาย การเคลื่อนไหวและความลึกหลายชั้น สถานการณ์ในเมืองและชนบท ฯลฯ	ลิงค์
CV	วีดีโอ	JAAD โดยมหาวิทยาลัยยอร์ก ประเทศยูเครน แคนาดา	ยานยนต์	Bounding Box ป้ายพฤติกรรม	"JAAD เป็นชุดข้อมูลสำหรับศึกษาความสนใจร่วมกันในบริบทของการขับขี่อัตโนมัติ โดยมุ่งเน้นที่พฤติกรรมคนเดินถนนและคนขับที่จุดข้ามและปัจจัยที่มีอิทธิพลต่อสิ่งเหล่านี้ ด้วยเหตุนี้ ชุดข้อมูล JAAD จึงนำเสนอคอลเลกชันวิดีโอสั้น 346 ที่มีคำอธิบายประกอบอย่างละเอียด คลิป (ความยาว 5-10 วินาที) ที่ดึงมาจากฟุตเทจการขับขี่กว่า 240 ชั่วโมงจากสถานที่ต่างๆ ในอเมริกาเหนือและยุโรปตะวันออก Bounding Boxes with occlusion tag ใช้สำหรับคนเดินเท้าทั้งหมดทำให้ชุดข้อมูลนี้เหมาะสำหรับการตรวจจับคนเดินถนน คำอธิบายประกอบเกี่ยวกับพฤติกรรมระบุพฤติกรรมสำหรับคนเดินถนน ที่โต้ตอบหรือต้องการความสนใจจากคนขับ สำหรับแต่ละวิดีโอ จะมีแท็กหลายแท็ก (สภาพอากาศ สถานที่ ฯลฯ) และป้ายกำกับพฤติกรรมที่ประทับเวลา (เช่น หยุด เดิน มอง ฯลฯ) นอกจากนี้ รายการคุณลักษณะทางประชากรคือ ให้คนเดินถนนแต่ละคน (เช่น อายุ เพศ ทิศทางการเคลื่อนไหว ฯลฯ) ตลอดจนรายการองค์ประกอบฉากจราจรที่มองเห็นได้ (เช่น ป้ายหยุด สัญญาณไฟจราจร ฯลฯ) ในแต่ละเฟรม"	ลิงค์
CV	วีดีโอ	KAIST Urban โดย KAIST ประเทศเกาหลีใต้	General	LiDAR	การรวบรวมข้อมูลประกอบด้วยเซ็นเซอร์ตำแหน่งจำนวนมากสำหรับข้อมูล LiDAR และภาพสเตอริโอที่กำหนดเป้าหมายไปยังเขตเมืองที่ซับซ้อนมาก (เช่น พื้นที่มหานคร อาคารที่ซับซ้อน และพื้นที่อยู่อาศัย)	ลิงค์
CV	ภาพ	ป้ายจราจร LISA โดย ม. แห่งแคลิฟอร์เนีย ซานดิเอโก สหรัฐอเมริกา	ยานยนต์	กล่องผูก	ชุดข้อมูลที่มีวิดีโอและเฟรมที่มีคำอธิบายประกอบซึ่งมีสัญญาณจราจรของสหรัฐอเมริกา มันถูกปล่อยออกมาในสองขั้นตอน หนึ่งมีเฉพาะรูปภาพและอีกอันที่มีทั้งรูปภาพและวิดีโอ	ลิงค์
CV	ภาพ	Mapillary Vistas โดย Mapillary AB, Global	ยานยนต์	ป้ายความหมาย	ชุดข้อมูลการถ่ายภาพระดับถนนสำหรับการตีความฉากบนท้องถนนทั่วโลกด้วยคำอธิบายประกอบของมนุษย์ที่มีความแม่นยำระดับพิกเซลและเฉพาะอินสแตนซ์	ลิงค์
CV	วิดีโอ, รูปภาพ	Semantic KITTI โดย University of Bonn, Karlsruhe ประเทศเยอรมนี	ยานยนต์	Bounding Box, Semantic Label, เครื่องหมายเลน	ชุดข้อมูลที่มีคำอธิบายประกอบเชิงความหมายสำหรับลำดับการเปรียบเทียบการวัดระยะทางทั้งหมด ชุดข้อมูลนี้อธิบายการจราจรที่เคลื่อนที่และไม่เคลื่อนที่ประเภทต่างๆ ได้แก่ รถยนต์ จักรยาน จักรยาน คนเดินเท้า และนักปั่นจักรยาน ซึ่งช่วยให้สามารถศึกษาวัตถุในที่เกิดเหตุได้	ลิงค์
CV	วีดีโอ	Stanford Track โดยมหาวิทยาลัยสแตนฟอร์ด สหรัฐอเมริกา	ยานยนต์	การตรวจจับวัตถุ / การจำแนกประเภท LiDAR, GPS, รหัส	ชุดข้อมูลที่มีแทร็กอ็อบเจ็กต์ติดป้ายกำกับ 14,000 รายการตามที่ Velodyne HDL-64E S2 LIDAR สังเกตในฉากท้องถนนตามธรรมชาติ ซึ่งสามารถใช้เพื่อฝึกโมเดลการเรียนรู้ของเครื่องสำหรับการรู้จำวัตถุ 3 มิติ	ลิงค์
CV	วิดีโอ, รูปภาพ	ชุดข้อมูล Boxy โดย Bosch ประเทศสหรัฐอเมริกา	ยานยนต์	Bounding Box / การตรวจจับยานพาหนะ	ชุดข้อมูลการตรวจจับยานพาหนะที่มียานพาหนะที่มีหมายเหตุ 2 ล้านคันสำหรับการฝึกอบรมและวิเคราะห์กลยุทธ์การจดจำวัตถุสำหรับรถยนต์ที่ขับด้วยตนเองบนทางหลวง	ลิงค์
CV	วีดีโอ	TME Motorway โดย Czech Technical Univ. ทางตอนเหนือของอิตาลี	ยานยนต์	กล่องผูก	ชุดข้อมูล 28 คลิป รวมเวลา 27 นาที แบ่งเป็นเฟรมคำอธิบายประกอบรถยนต์กว่า 30,000 เฟรม สร้างคำอธิบายประกอบแบบกึ่งอัตโนมัติโดยใช้ข้อมูลจากเครื่องสแกนเลเซอร์ การรวบรวมข้อมูลนี้เกี่ยวข้องกับสถานการณ์การจราจรที่แปรปรวน จำนวนเลน ความโค้งของถนน และไฟส่องสว่าง ซึ่งครอบคลุมเงื่อนไขส่วนใหญ่ของการได้มาทั้งหมด	ลิงค์
CV	วีดีโอ	Llamas ที่ไม่มีผู้ดูแล โดย Bosch ประเทศสหรัฐอเมริกา	ยานยนต์	เครื่องหมายเลน LiDAR	ชุดข้อมูล Llamas ที่ไม่มีผู้ดูแลได้รับการบันทึกโดยการสร้างแผนที่การขับขี่อัตโนมัติที่มีความละเอียดสูง ซึ่งรวมถึงเครื่องหมายบอกเลนตาม Lidar รถยนต์ไร้คนขับสามารถจัดวางให้ชิดกับแผนที่เหล่านี้ และเครื่องหมายเลนจะถูกฉายเข้าไปในเฟรมของกล้อง การฉายภาพ 3 มิติได้รับการปรับให้เหมาะสมโดยลดความคลาดเคลื่อนระหว่างเครื่องหมายภาพที่สังเกตแล้วและคาดการณ์ไว้	ลิงค์
NLP	เสียง	Facebook AI LibriSpeech หลายภาษา (MLS)	General	คำอธิบายประกอบเสียง / การรู้จำเสียง	Facebook AI Multilingual LibriSpeech (MLS) เป็นชุดข้อมูลโอเพ่นซอร์สขนาดใหญ่ที่ออกแบบมาเพื่อช่วยให้การวิจัยขั้นสูงในการรู้จำคำพูดอัตโนมัติ (ASR) MLS ให้เสียงมากกว่า 50,000 ชั่วโมงใน 8 ภาษา: อังกฤษ เยอรมัน ดัตช์ ฝรั่งเศส สเปน อิตาลี โปรตุเกส และโปแลนด์	ลิงค์

เปิดชุดข้อมูล

ชุดข้อมูลโอเพนซอร์สเพื่อให้คุณเริ่มต้นใช้งานโมเดล AI/ML

บริการข้อมูล AI

พิเศษ

Industry

ผลิตภัณฑ์

บริษัท

แหล่งข้อมูล

ติดต่อเรา