위급상황 음성/음향 소개
기본탭
데이터셋명 | 위급상황 음성/음향 | |||
---|---|---|---|---|
데이터 분야 | 안전 | 데이터 유형 | 텍스트, 오디오 | |
구축기관 | 아이엠알 | 데이터 관련 문의처 | 담당자명 | 이정옥(아이엠알) |
가공기관 | 아이엠알,티맥스AI, 티맥스AI개발센터 | 전화번호 | 062-417-9522 | |
검수기관 | 브이티더블유,엠포러스 | 이메일 | jolee@imrbiz.co.kr | |
구축 데이터량 | 504만 | 구축년도 | 2020년 | |
버전 | 1.1 | 최종수정일자 | 2021.11.18 | |
소개 | 위급상황 발생에 따른 다양한 상황과 환경별 음성 및 음향 데이터 | |||
주요 키워드 | 위급상황 음성, 이상탐지, 취약계층 돌봄 음성, 위급상황 인지, 음성인식 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 다운로드 | 교육활용동영상 | 영상보기 | |
저작도구 | 다운로드 | AI모델 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.1 | 2021.11.18 | 데이터 품질 보완 | |
1.0 | 2021.06.18 | 데이터 최초 개방 |
구축 목적
- 취약계층의 위급상황 대처를 위한 기술 개발에 필요한 음성/음향 데이터셋
활용 분야
- 위급상황 음성·음향 데이터를 기반으로 취약계층의 위급상황을 자동 진단·상황 추론 기술 확보로 독거노인, 중증 장애인, 아동, 여성 등의 맞춤형 복지 및 안전 서비스 제공
주요 키워드
- 사회 안전 AI 데이터, 음성·음향 위급상황 , 상태인지, 객체 검출 분류
소개
- 공개사이트와 직접녹음, 크라우드소싱을 통해 수집한 위급상황 음성·음향 데이터를 수집 정제, 가공하여 고품질을 확보한 데이터셋으로, 취약계층 위급상황 인지 판단 시스템에 특화된 데이터셋으로 음향 관련 연구 및 파생 서비스 개발에 활용 가능
구축 내용 및 제공 데이터량
- 데이터 구축 결과 16종의 응급상황 음성/음향 데이터를 총 3,500 시간 이상 구축
- 음성 및 음향 단일 데이터로 상황판단하기 어려운 경우 원음을 합성하여 생성
- 위급상황 음성/음향 데이터는 16bit 44.1kHz의 CD음질인 WAV 파일로서 기본 포맷은 각 WAV + JSON 파일 쌍으로 구성되어 있음
대분류 | 중분류 | 구축목표(시간) | 실 구축량(시간) |
---|---|---|---|
치안안전 | 강제추행 | 100 | 104 |
강도범죄 | 100 | 103 | |
절도범죄 | 100 | 101 | |
폭력범죄 | 200 | 201 | |
소방안전 | 갇힘 | 100 | 103 |
전기사고 | 200 | 203 | |
가스사고 | 150 | 152 | |
화재 | 450 | 458 | |
응급의료 | 450 | 452 | |
자연재해 | 태풍/강풍 | 300 | 303 |
지진 | 100 | 107 | |
사고발생 | 낙상 | 150 | 154 |
붕괴사고 | 100 | 101 | |
일반(위급) | 도움요청 | 300 | 305 |
일반(정상) | 실내 | 500 | 510 |
실외 | 200 | 202 | |
합계 | 3,500 | 3,559 |
대표도면
<음성/음향데이터 라벨링 결과>
<분류 결과 화면>
필요성
- 비명 소리 등 피해자의 구조 요청 음성을 통한 구조 사례 다수 있으며, 비명 소리를 자동 감지하여 경찰에 자동 구조 요청하는 시스템 구축 사례 있음
- 독거노인, 중증장애인 등 취약계층은 신체활동의 어려움과 함께 일상생활 능력 중 의사소통능력에서 가장 어려움을 겪고 있어 음향/음성 기반 시스템 구축이 필요함에도 이를 위한 AI 학습 음향/음성 데이터셋 구축을 하고자 함
데이터 구조
- 데이터 구성
데이터 구성 표 항목 내용 파일명 3.절도범죄_606014.wav 플레이 시간 20.9 라이센스 CC 0(저작권없음) 대분류 치안안전 중분류 절도범죄 소분류(상황) 치안안전_도둑이야_비명소리 내용 도둑이 침입한 상황 어노테이션 시작 시간 5 어노테이션 종료 시간 15.9 유형 음성 음향 성별 여자 - 연령 성인 - 지역 서울 - 억양 표준 - 구성예시
- 어노테이션 포맷
어노테이션 포맷 표 No 항목 필수여부 한글명 영문명 1 정보 info 1-1 정보 설명 info.description Y 1-2 정보 주소 info.url Y 1-3 정보 버전 info.version Y 1-4 정보 제작년도 info.year Y 1-5 정보 제작자 info.contributer Y 1-6 정보 생성일자 date_created Y 2 라이선스 license 2-1 라이선스 주소 license.url Y 2-2 라이선스 명칭 license.name Y 3 오디오 audio 3-1 오디오 명칭 audio.fileName Y 3-2 오디오 크기 audio.fileSize Y 3-3 오디오 길이 audio.duration Y 3-4 오디오 종류 audio.audioType Y 3-5 오디오 포맷 audio.fileFormat Y 3-6 오디오 샘플레이트 audio.sampleRate Y 3-7 오디오 비트레이트 audio.bitRate Y 3-8 오디오 녹음방식 audio.recordingType Y 3-9 오디오 취득방식 audio.acquisitionType Y 3-10 오디오 취득장치 audio.acquisitionDevice Y 3-11 오디오 취득장소 audio.acquisitionPlace Y 4 어노테이션 annotations 4-1 어노테이션 식별자 annotations.audio.id Y 4-2 영역 annotations.area Y 4-3 시작 annotations.area.start Y 4-4 종료 annotations.area.end Y 4-5 카테고리 annotations.categories Y 4-6 대분류 annotations.category_01 Y 4-7 중분류 annotations.category.category_02 Y 4-8 소분류 annotations.category.category_03 Y 4-9 설명 annotations.note Y 4-10 오디오 유형 annotations.audioType Y 4-11 성별 annotations.gender N 4-12 연령 annotations.generation N 4-13 지역 annotations.residence N 4-14 억양 annotations.dialect N 4-15 음질 annotations.soundQuality Y 4-16 거리 annotations.soundDistance Y
데이터셋 구축 담당자
수행기관(주관) : 아이엠알
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
조성훈 | 062-417-9522 | csh@imrbiz.co.kr | · 데이터 구축 총괄 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
(주)브이티더블유 | · 데이터 검사 및 품질관리 | (주)엠포러스 | · 데이터 검사 |
(주)티맥스AI | · 데이터 가공 | (주)티맥스AI개발센터 | · 데이터 가공 |