수질측정 및 오염원 소개
기본탭
데이터셋명 | 수질측정 및 오염원 | |||
---|---|---|---|---|
데이터 분야 | 국토환경 | 데이터 유형 | 텍스트, 센서 | |
구축기관 | 시티랩스(舊 데일리블록체인) | 데이터 관련 문의처 | 담당자명 | 김대석(씨이기술) |
가공기관 | 씨이기술, 엔지스, 파이텍, 소다시스템, 아토스 | 전화번호 | 02-6670-4600 | |
검수기관 | 씨이기술, 소다시스템 | 이메일 | dskim@cetech.kr | |
구축 데이터량 | 14,900만 | 구축년도 | 2020년 | |
버전 | 1.0 | 최종수정일자 | 2021.06.25 | |
소개 | 수질 및 오염원 관리 AI 활용 서비스 개발을 위한 수질 측정(수소, 수소 이온 등) 및 5대 오염원(인구, 축산, 토지, 양식장, 산업 폐수) 데이터 | |||
주요 키워드 | 환경, 환경오염, 환경예측, 수질, 수질예측, AI데이터 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 다운로드 | 교육활용동영상 | 영상보기 | |
저작도구 | 다운로드 | AI모델 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.0 | 2021.06.25 | 데이터 최초 개방 |
구축 목적
- 민간·공공의 수요를 기반으로 양질의 AI 데이터를 대규모로 구축·공개하고 활용을 촉진하여 AI데이터 선순환 생태계 조성
활용 분야
- 전국 단위 수질측정 및 5대 오염원(인구, 축산, 토지, 양식장, 산업폐수) 데이터로, 수질관리와 오염원 관리 자동화 AI 서비스 개발에 활용 가능
소개
- 수질/ 자동/ 총량/ 퇴적물/ 방사성물질/ KRF 등이 포함된 물환경 측정망 수질 측정자료 및 수질 관련 측정자료와 인구·가구/ 전국오염원/ 환경기초시설의 오염원 관련 측정 자료에 대한 데이터 수집 및 정제, 가공. 수집된 데이터를 기준으로 AI학습용 데이터로 설계 및 구축하기 위해 데이터 표준화 및 정규화, 관계형 엔티티 등록 및 구축을 통해 AI 데이터 활용
구축 내용 및 제공 데이터량
구분 | 구축 내용 | 제공 데이터량 |
---|---|---|
물환경측정망 | 수질측정망, 총량측정망, 자동측정망, 퇴적물측정망 방사성물질측정망, 비점오염물질측정망, KRF지형지표 |
272,406,401 |
인구, 가구 및 주택 통계 |
전국규모의 인구, 가구, 주택 통계 | 100,089 |
수질TMS | 수도권, 영남권, 충청권, 호남권의 공공하수, 공공폐수, 폐수배출 시설의 방류 수질 측정 |
89,439,324 |
녹조(조류)모니터링 | 강, 호수의 녹조 및 조류 측정 자료 | 14,276,928 |
수리, 수문, 기상 | 하천 수면 높이, 하천물 부피 및 강우량 측정 | 224,802,163 |
전국 오염원 조사자료 |
생활계, 축산계, 산업계, 토지계, 양식계, 매립계, 환경기초시설현황, 기타수질오염원 조사 |
146,547,822 |
기상자료(AWS) | 기상관측 장비로 관측한 시간 기상자료 | 11,257,980 |
종관기상관측 (ASOS) |
지역 기상대의 모든 관측소에서 같은 시각에 실시하는 지상관측 | 2,386,937 |
합계 | 761,217,644 |
대표도면
- 1. 데이터셋 구성도
- 2. JSON 파일 포맷 구조 예시
필요성
- 지금까지 AI 데이터들을 이용하여 출입보안, 기계번역 등 다양한 영역에 응용되어왔으나, 본 사업을 통하여 환경오염 관리에 활용 범위를 넓힘
- 우리나라는 AI 학습용 수질 및 오염원 데이터의 축적·개방 활용 수준 미흡
- AI 서비스 기반의 수질예측 데이터의 품질 및 정확성 향상에 대한 객관적 분석 결과를 홍보하여 사용자들의 자발적 도입 및 수질관련 기관과 대학 등 연구기관에 기술 적용에 따른 객관적 분석 결과를 홍보하여 데이터 사용을 희망하는 지자체 담당자나 연구원들이 데이터를 활용할 수 있도록 데이터를 구축하고자 함
데이터 구조
- 수질측정망
수질측정망 데이터 구조 표 데이터_영문 데이터_한글 데이터 타입 항목크기 샘플데이터 해당없음 년도 VARCHAR 4 1992 월 VARCHAR 2 10 회차 VARCHAR 10 1회차 수질측정망 명 VARCHAR 100 소양강댐3 수질측정망 코드 VARCHAR 7 1012B30 위도 DECIMAL 14,6 38.034847 경도 DECIMAL 14,6 127.962744 검사일자 VARCHAR 8 19921022 항목코드 VARCHAR 10 1049 항목 명 VARCHAR 100 화학적산소요구량(COD) 값 DOUBLE 2 항목 정제 여부 VARCHAR 1 1 CAT_ID 집수구역ID VARCHAR 8 10141203 CAT_DID 분할구역ID VARCHAR 10 1014120300
- 메타데이터 구조
: 메타데이터는 측정값으로 정의되는 공통분야와 GIS정보로 정의되는 GIS 메타데이터로 구분하여 관리되고, 측정망 및 항목 기준으로 메타데이터는 정의된다
수질 데이터 메타데이터 목록 표 No 항목 길이 타입 필수여부 비고 영문명 한글명 1 공통_메타데이터_관리 COM_METDATA_MANAGE TABLE 1-1 데이터_명 DATA_NM 300 VARCHAR2 Y 1-2 데이터_정의_내용 DATA_DFN_CN 2000 VARCHAR2 1-3 데이터_분야_내용 DATA_REALM_CN 2000 VARCHAR2 Y 1-4 관리_부서_명 MANAGE_DEFT_NM 300 VARCHAR2 Y 1-5 시작_년도 BEGIN_YEAR 4 VARCHAR2 Y 1-6 종료_년도 END_YEAR 4 VARCHAR2 Y 1-7 생산_주기_구분_명 PRDCTN_CYCLE_SE_NM 300 VARCHAR2 Y 1-8 데이터_형태_내용 DATA_STLE_CN 2000 VARCHAR2 Y 1-9 데이터_크기 DATA_MG NUMBER 1-10 주요_항목_내용 MAIN_IEM_CN 2000 VARCHAR2 Y 1-11 생산_방법_내용 PRDCTN_MTH_CN 2000 VARCHAR2 Y 1-12 비고_내용 RM_CN 2000 VARCHAR2 2 공통_GIS_메타데이터_관리 COM_GIS_METDATA_MANAGE TABLE 2-1 데이터_명 DATA_NM 300 VARCHAR2 Y 2-2 주제_분류_내용 THEMA_CL_CN 2000 VARCHAR2 Y 2-3 기준계_명 REFSYS_NM 300 VARCHAR2 Y 2-4 지리_범위_내용 GRPH_SCOPE_CN 2000 VARCHAR2 Y 2-5 식별_코드 IDNTFC_CODE 10 VARCHAR2 Y 2-6 사용_언어_명 USE_LANG_NM 300 VARCHAR2 Y 2-7 문자셋_내용 CHRSET_CN 2000 VARCHAR2 Y 2-8 요약_내용 SUMRY_CN 2000 VARCHAR2 2-9 생성_일자 CREAT_DE 8 VARCHAR2 Y 2-10 생성_주기_구분_명 CREAT_CYCLE_SE_NM 300 VARCHAR2 Y 2-11 데이터_포맷_명 DATA_FRMAT_NM 300 VARCHAR2 Y 2-12 관리_주기_구분_명 MANAGE_CYCLE_SE_NM 300 VARCHAR2 Y
데이터셋 구축 담당자
수행기관(주관) : 시티랩스(舊 데일리블록체인)
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
조영중 | 031-470-4800 | yjcho@citylabs.co.kr | · 데이터구축 총괄 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
(주)씨이기술 | · 원시데이터 확보 및 정제, 가공. 데이터구축 총괄 | (주)엔지스 | · 원시데이터 확보 및 정제, 가공 |
(주)파이텍 | · 원시데이터 확보 및 정제, 가공 | (주)아토스 | · 원시데이터 확보 및 정제, 가공. 활용 API 개발 |
(주)코테크시스템 | · AI 모델 및 응용서비스(수질예측서비스) 개발 | (주)소다시스템 | · 데이터 가공 및 검수 |