반응형
the age of data (데이터의 시대)
- 데이터의 생산 주체 : 기업 + 일반 개인
- 개인이 생산하는 데이터의 예 : 스마트폰의 위치 정보, 통화 정보, 신용카드 결제 정보, 교통카드 이용 정보, 인터넷 검색정보, SNS
- 데이터 활용 방안 : 실시간 교통정보를 활용하는 개인 활동 + 고객의 주문 내역을 분석해 신상품 개발에 활용
- 데이터 활용을 통해서 -> 사람이 몰리는 버스 시간대를 알아내, 그 시간 대 버스를 늘려 삶의 질을 높였다.
- 광주시 데이터 활용의 예 -> 교통카드 이력, 주거 유동인구 데이터 등을 활용해 시민의 거주 위치와 버스, 지하철 정류장의 위치 데이터를 분석해, 시내버스의 효율적인 운영을 위한 과학적인 분석 결과를 도출 하였다.
- 전 지역을 작게 나눠, 버스 정류장 수가 부족한 지역 중 10개 지역을 대중교통 사각지대로 선정해, 교통 약자가 많이 이용하는 편의시설 위치를 분석해 16개의 버스 노선을 선정함.
- 교통 약자가 많이 이용하는 노선에 지상버스 40대를 추가 도입.
- 교통카드 데이터를 분석해 -> 출퇴근 시간대 이용자가 많은 노산에 배차간격을 조정함.
- 데이터를 통해 현실의 문제를 해결하고, 경제적 이익까지도 창출 할 수 있다.
이름 | 명언 | 사진 |
---|---|---|
셜록 홈즈 | 데이터 없이 어떤 가설을 세우는 것은 중대한 실수이다. | ![]() |
제프 웨이너 | 데이터는 실제로 우리가 하는 모든 일에 힘을 실어준다. | ![]() |
클리브 흄비 | 데이터는 새로운 석유이다. | ![]() |
토마스 레드맨 | 데이터가 있는 곳에 비즈니스가 있다. | ![]() |
- 다보스포럼(세계정제포럼) -> 우리가 4차 산업혁명의 시대에 들어섰다.
- 디지털 혁명에 기반하여 물리적 공간, 디지털적 공간 및 생물학적 공간의 경계가 희석되는 기술 융합의 시대
- 핵심 기술 : 블록체인, 빅데이터, 인공지능, 로봇공학, 양자암호, 사물인터넷, 자율주행 운송수단, 3D 프린팅
- Data Economy : 데이터의 활용이 경제활동의 중요한 생산요소로 사용되는 경제구조
- 대한민국 정부도 금융, 환경, 문화미디어, 교통, 헬스케어, 유통물류, 통신, 중소기업, 지역경제, 산림 등 10개 분야에서 빅데이터 플랫폼을 구축하기 위해 투자
- 용어?
관리하고자 하는 데이터들을 한곳에 체계적으로 모아 놓은 것을 데이터베이스라고 하고, 이러한 데이터베이스를 관리할 목적으로 만들어진 소프트웨어를 데이터베이스 매니지먼트 시스템이다. - 데이터베이스가 나오기 까지
- 엑셀과 같은 스프레드시트 SW를 이용. (문제점: 관리할 데이터의 양이 많고, 여러 데이터를 연결해 정보를 얻기 원하는 경우 스프레드시트 SW로는 해결이 어려움)
- 데이터 종속성(data dependency) : 데이터를 이용하는 프로그램이 데이터의 구조 변화에 영향을 받는 현상을 말한다.
- 데이터 무결성(data integrity) : 데이터가 오류가 없는 정확한 값을 저장하고 있어야함을 의미.
- 데이터 중복성(data redundancy) : 동일한 정보가 여러 곳에 중복해서 존재하는 것을 의미.
- 데이터 불일치(data inconsistency): 중복된 데이터의 내용이 서로 상이하여 발생하는 문제
- 데이터 보안성(data security) : 데이터를 안전하게 관리할 수 있는 솔루션이 필요.
- 데이터 표준화(data standardization) : 변수이름의 통일이 어려움.
- 관계형 데이터베이스(relational database) 모델
- 데이터가 테이블 형태로 표현
- 사용자가 데이터를 쉽게 다룰 수 있도록, SQL를 제공
- 비 관계형 데이터베이스(non-relational database) 모델
- SNS, 문자 메이싲, 이미지 데이터 등 비정형 데이터의 증대로 기존 관계형 데이터베이스로는 처리가 어려운 데이터들이 증가
- NoSQL등장 : "Not Only SQL"
- 데이터베이스 시스템
- 데이터베이스를 이용해 데이터를 저장하고 처리하는 시스템
- 데이터베이스 : 조직이 관리하는 데이터를 한 곳에 체계적으로 모아 놓은 것.
- DBMS: 모아 놓은 데이터를 관리하고, 사용자의 요구를 처리해주는 소프트웨어
- 데이터베이스 서버 : 데이터베이스/DBMS가 설치된 컴퓨터
- 데이터베이스의 구현
- 물리적인 저장장치인 하드 디스크상에 구현
- 시스템 카탈로그 (데이터 사전) : 데이터베이스를 관리하기 위한 정보를 담고 있는 테이블
- 시스템 카탈로그 = 메타데이터 = 데이터베이스 스키마 = 데이터 사전
- 데이터베이스 사용자
- 최종 사용자 -> 캐주얼 사용자, 초보 사용자
- 개주얼 사용자 -> 질의어를 이용해 매번 다른 정보를 검색
- 초보 사용자 -> 이미 작성된 프로그램을 통해 동일작업을 주로 반복해서 수행
- 응용 프로그래머
- 데이터베이스 관리자
- 데이터 모델
- 현실세계에 존재하는 데이터, 정보를 컴퓨터 안에 표현하는 방식
- 사용자의 눈으로 보았을 때 데이터가 어떤 모양으로 보이게 할 것인가? ( 논리적 모델 )
- 데이터를 물리적으로 저장 할 때 어떻게 할 것인가? (물리적 모델)
- 관계 데이터 모델과 제약조건!
- IBM 연구소 E.F. Codd가 1970년에 관계 데이터 모델을 제안함.
- 바탕이 되는 데이터 구조로서 간단한 테이블(릴레이션)을 사용.
- 중첩된 복잡한 구조가 없음
- 집합 위주로 데이터를 처리
- 숙련되지 않은 사용자도 쉽게 이해할 수 있음.
- 표준 데이터베이스 응용에 대해 좋은 성능을 보임
- 다른 데이터 모델에 비해 이론이 잘 정립되었음
- 관계 데이터베이스 설계와 효율적은 질의 처리 면에서 뛰어난 장점을 가짐
- 용어
- 릴레이션 : 2차원의 테이블
- 레코드 : 릴레이션의 각 행
- 튜플 : 레코드를 좀 더 공식적으로 부르는 용어
- 애트리뷰트 : 릴레이션에서 이름을 가진 하나의 열
- 도메인 : 한 애트리뷰트에 나타날 수 있는 값들의 집합.
- 차수 : 한 릴레이션에 들어 있는 애트리뷰트들의 수
- 카디날리티 : 릴레이션의 튜플 수
- 릴레이션 스키마 : 릴레이션의 이름과 릴레이션의 애트리뷰트들의 집합
- 릴레이션 인스턴스 : 어느 시점에 들어있는 튜플들의 집합
- 릴레이션의 키
- 슈퍼 키 : 한 릴레이션 내의 특정 튜플을 고유하게 식별하는 하나의 애트리뷰트 또는 애트리뷰트들의 집합 (유일성 o, 최소성 x)
- 후보 키 : 각 튜플을 고유하게 식별하는 최소한의 애트리뷰트들의 모임
- 복합 키 : 후보키가 두 개 이상의 애트리뷰트로 이뤄져 있을 때 (유일성 o, 최소성 o)
- 기본 키 : 후보 키가 두 개 이상 있으면 설계자 또는 데이터베이스 관리자가 이들 중에서 하나를 기본 키로 설정.
- 대체 키 : 기본 키가 아닌 후보 키
- 외래 키 : 어떤 릴레이션의 기본 키를 참조하는 애트리뷰트
- 제약 조건
- 도메인 제약조건 : 각 애트리뷰트 값이 반드시 원자 값이어야 함.
- 키 제약조건 : 키 애트리뷰트에 중복된 값이 존재해서는 안됨.
- 기본키와 엔티티 무결성 제약조건 : 릴레이션의 기본 키를 구성하는 어떤 애트리뷰트도 널값을 가질 수 없음.
- 외래 키와 참조 무결성 제약조건 : 참조 무결성 제약조건은 두 릴레이션의 연관된 튜플들 사이의 일관성을 유지하는데 사용됨.
- 무결성 제약조건 : 갱신연산 -> 삽입, 삭제, 수정가 있는데, 이 연산 수행 시 데이터 무결성을 만족시켜야 한다.
반응형
'학교 수업 > 데이터베이스' 카테고리의 다른 글
SQL 문 (0) | 2023.10.29 |
---|---|
orders, customers, book (0) | 2023.10.18 |
CREATE, ALTER, DROP코드 (0) | 2023.10.18 |