장면인식‧인물인식을 위한 방송 영상 소개
기본탭
데이터셋명 | 장면인식‧인물인식을 위한 방송 영상 | |||
---|---|---|---|---|
데이터 분야 | 비전 | 데이터 유형 | 비디오 | |
구축기관 | 줌인터넷 | 데이터 관련 문의처 | 담당자명 | 이수윤(줌인터넷) |
가공기관 | 줌인터넷, 채널봄, 인피닉, 솔트룩스, 알디프로젝트, 마인즈랩, 지플러스 | 전화번호 | 02·583·4640 | |
검수기관 | 채널봄, 인피닉, 솔트룩스 | 이메일 | tndbs83@zuminternet.com | |
구축 데이터량 | 93.6만 | 구축년도 | 2020년 | |
버전 | 1.4 | 최종수정일자 | 2022.01.12 | |
소개 | 미디어 영상의 비디오 및 프레임 데이터를 기반으로 미디어 장면을 분류하고, 미디어 영상 내 인물을 자동 검출 분석하기 위한 영상 데이터 | |||
주요 키워드 | 객체인식, 장면인식, 인물인식, 방송영상 데이터셋, 연예인 데이터, 연예인 닮은꼴 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 다운로드 | 교육활용동영상 | 영상보기 | |
저작도구 | 다운로드 | AI모델 | 다운로드 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.4 | 2022.01.12 | 누락 데이터 추가 보완 | |
1.3 | 2022.01.10 | 데이터 품질 보완 | |
1.2 | 2021.10.07 | 데이터 추가 개방 | |
1.1 | 2021.09.15 | 데이터 추가 개방 | |
1.0 | 2021.06.30 | 데이터 최초 개방 |
구축목적
- 저작권, 지재권, 초상권, 특허권 등 적법성이 확보된 원본 데이터 및 가공 데이터의 구축·제공을 통해 지능형 영상 인식 AI의 학습 개발에 활용하기 위한 데이터셋 구축
활용분야
- 방송사 영상을 대상으로 구축하여, 실제 방송에서 획득할 수 있는 다양한 산업에서 활용 가능
- 장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터는 OBS, YTN, EBS 등 방송사 영상 및 개인으로부터 수집한 다양한 영상을 대상으로 인물, 장면, 객체 정보를 라벨링함
소개
- 방송사 및 개인으로부터 수집한 영상에 라벨링된 데이터셋으로, 다양한 장 르의 영상에 라벨링된 객체, 상황, 인물등의 라벨링 정보를 담고 있으며 학 습 데이터로 활용 가능하도록 지적재산권, 초상권 등 법적 문제를 해결한 원천 데이터를 활용함
- 장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터는 OBS, YTN, EBS 등 방송사 영상 및 개인으로부터 수집한 다양한 영상을 대상으로 인물, 장면, 객체 정보를 라벨링함
구축 내용 및 제공 데이터량
- 90번은 약 670시간 가량의 동영상을 대상으로 라벨링된 데이터로 구성
장면인식‧인물인식을 위한 방송 영상 내용 및 데이터량 표 세부과제명 데이터 형태 목표 수량 구축량 90번 객체 700만개 이상 약 800만개 인물 200명 241명, 14만개 장면 - 29종, 21만개
대표도면

필요성
- AI 학습 데이터는 4차 산업 혁명 시대의 중요한 생산 요소로 미국/ 유럽 등 AI 선도국에서는 정부와 민간이 협업하여 대규모의 데이터를 구축하고 있는 것에 반해, 한국은 비교적 경쟁력이 뒤쳐져 있어 이에 대한 대응 방안의 필요성이 대두되고 있음
- 다만 국내 중소, 벤처 기업들은 오랜 시간과 많은 비용이 발생하는 AI 학습용 원천 데이터의 확보 부담으로 제품 서비스 개발에 어려움을 겪고 있음
- 이에 저작권, 지재권, 초상권 등의 적법석이 확보된 원본 데이터 및 가공 데이터의 구축과 제공을 통해 중소/벤처기업 및 스타트업과 다양한 기관, 연구소 등에서 자유롭게 연구개발이 가능한 토대를 마련하고자 함
데이터구조
- 객체
객체표 depth 항목 description 예시 1 info 데이터셋 정보 - 1.1. version 버전 정보 1.0.0 1.2. name 데이터셋 이름 #99 객체 데이터셋 1.3. description 데이터셋 설명 프레임 단위의 객체 태깅 1.4. created_at 생성 날짜 43885 2 annotation 라벨링 정보 - 2.1 frames 이미지 정보 - 2.1.1. filepath 이미지 경로 /EBS/program-0000/video-0000/0000000048.png" 2.1.2. object 객체 라벨링 정보 - 2.1.2.1. category_id 객체명 id 0 2.1.2.2. bbox 바운딩박스
(X-min, Y-min, width, heigh)564, 182, 659, 898 3 categories 객체명 정보 - 3.1. id 객체명 번호 0 3.2. name 객체명 한글 아이 - 인물
depth 항목 description 예시 1 info 데이터셋 정보 - 1.1. version 버전 정보 1.0.0 1.2. name 데이터셋 이름 #99 인물 데이터셋 1.3. description 데이터셋 설명 프레임 단위의 인물 태깅 1.4. created_at 생성 날짜 43885 2 annotation 라벨링 정보 - 2.1. filepath 이미지 경로 filepath": "/OBS/program-0000/video-0000/0000000010.png 2.2. people 인물 라벨링 정보 - 2.2.1. category_id 인물명 id 201 2.2.2. bbox 바운딩박스
(X-min, Y-min, width, heigh)1166, 317, 54, 74 3 categories 인물 카테고리 정보 3.1. id 인물명 번호 201 3.2. name 인물명 한글 조영남 - 장면
depth 항목 description 예시 1 info 데이터셋 정보 - 1.1. version 버전 정보 1.0.0 1.2. name 데이터셋 이름 #99 장면 데이터셋 1.3. description 데이터셋 설명 프레임 단위의 장면 태깅 1.4. created_at 생성 날짜 43885 2 annotation 라벨링 정보 - 2.1 frames 이미지 정보 - 2.1.1. filepath 이미지 경로 "/YTN/program-0000/video-0000/0000000000.png 2.1.2. category_id 장면명 id 0 2.1.3. object 객체 라벨링 정보 - 2.1.3.1. category_id 객체명 id 0 2.1.3.2. bbox 바운딩박스
(X-min, Y-min, width, heigh)51, 143, 410, 485
데이터셋 구축 담당자
수행기관(주관) : 줌인터넷
책임자 | 연락처(대표전화) | 대표 이메일 | 담당업무 |
---|---|---|---|
이수윤 | 02-583-4640 | tndbs83@zuminternet.com | · PM |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
피플레이 | · 콘텐츠 업무 | 마인즈랩 | · 데이터 구조화 및 전처리, 라벨링 |
인피닉 | · 저작도구, 데이터 라벨링 (크라우드소싱 활용) | 채널봄 | · 데이터 가공 및 품질검수 |
솔트룩스 | · 데이터 가공 및 품질검수 | 알디프로젝트 | · 데이터 가공 |
지플러스 | · 데이터 가공 |