본문 바로가기

학교 수업/데이터베이스

데이터베이스

반응형

the age of data (데이터의 시대)

  • 데이터의 생산 주체 : 기업 + 일반 개인
  • 개인이 생산하는 데이터의 예 : 스마트폰의 위치 정보, 통화 정보, 신용카드 결제 정보, 교통카드 이용 정보, 인터넷 검색정보, SNS
  • 데이터 활용 방안 : 실시간 교통정보를 활용하는 개인 활동 + 고객의 주문 내역을 분석해 신상품 개발에 활용
  • 데이터 활용을 통해서 -> 사람이 몰리는 버스 시간대를 알아내, 그 시간 대 버스를 늘려 삶의 질을 높였다.
  • 광주시 데이터 활용의 예 -> 교통카드 이력, 주거 유동인구 데이터 등을 활용해 시민의 거주 위치와 버스, 지하철 정류장의 위치 데이터를 분석해, 시내버스의 효율적인 운영을 위한 과학적인 분석 결과를 도출 하였다.
  • 전 지역을 작게 나눠, 버스 정류장 수가 부족한 지역 중 10개 지역을 대중교통 사각지대로 선정해, 교통 약자가 많이 이용하는 편의시설 위치를 분석해 16개의 버스 노선을 선정함.
  • 교통 약자가 많이 이용하는 노선에 지상버스 40대를 추가 도입.
  • 교통카드 데이터를 분석해 -> 출퇴근 시간대 이용자가 많은 노산에 배차간격을 조정함.
  • 데이터를 통해 현실의 문제를 해결하고, 경제적 이익까지도 창출 할 수 있다.
이름 명언 사진
셜록 홈즈 데이터 없이 어떤 가설을 세우는 것은 중대한 실수이다. img_3.png
제프 웨이너 데이터는 실제로 우리가 하는 모든 일에 힘을 실어준다. img_2.png
클리브 흄비 데이터는 새로운 석유이다. img_1.png
토마스 레드맨 데이터가 있는 곳에 비즈니스가 있다. img.png
  • 다보스포럼(세계정제포럼) -> 우리가 4차 산업혁명의 시대에 들어섰다.
  • 디지털 혁명에 기반하여 물리적 공간, 디지털적 공간 및 생물학적 공간의 경계가 희석되는 기술 융합의 시대
  • 핵심 기술 : 블록체인, 빅데이터, 인공지능, 로봇공학, 양자암호, 사물인터넷, 자율주행 운송수단, 3D 프린팅
  • Data Economy : 데이터의 활용이 경제활동의 중요한 생산요소로 사용되는 경제구조
  • 대한민국 정부도 금융, 환경, 문화미디어, 교통, 헬스케어, 유통물류, 통신, 중소기업, 지역경제, 산림 등 10개 분야에서 빅데이터 플랫폼을 구축하기 위해 투자
  • 용어?
    관리하고자 하는 데이터들을 한곳에 체계적으로 모아 놓은 것을 데이터베이스라고 하고, 이러한 데이터베이스를 관리할 목적으로 만들어진 소프트웨어를 데이터베이스 매니지먼트 시스템이다.
  • 데이터베이스가 나오기 까지
  1. 엑셀과 같은 스프레드시트 SW를 이용. (문제점: 관리할 데이터의 양이 많고, 여러 데이터를 연결해 정보를 얻기 원하는 경우 스프레드시트 SW로는 해결이 어려움)
  2. 데이터 종속성(data dependency) : 데이터를 이용하는 프로그램이 데이터의 구조 변화에 영향을 받는 현상을 말한다.
  3. 데이터 무결성(data integrity) : 데이터가 오류가 없는 정확한 값을 저장하고 있어야함을 의미.
  4. 데이터 중복성(data redundancy) : 동일한 정보가 여러 곳에 중복해서 존재하는 것을 의미.
  5. 데이터 불일치(data inconsistency): 중복된 데이터의 내용이 서로 상이하여 발생하는 문제
  6. 데이터 보안성(data security) : 데이터를 안전하게 관리할 수 있는 솔루션이 필요.
  7. 데이터 표준화(data standardization) : 변수이름의 통일이 어려움.
  • 관계형 데이터베이스(relational database) 모델
  1. 데이터가 테이블 형태로 표현
  2. 사용자가 데이터를 쉽게 다룰 수 있도록, SQL를 제공
  • 비 관계형 데이터베이스(non-relational database) 모델
  1. SNS, 문자 메이싲, 이미지 데이터 등 비정형 데이터의 증대로 기존 관계형 데이터베이스로는 처리가 어려운 데이터들이 증가
  2. NoSQL등장 : "Not Only SQL"
  • 데이터베이스 시스템
  1. 데이터베이스를 이용해 데이터를 저장하고 처리하는 시스템
  2. 데이터베이스 : 조직이 관리하는 데이터를 한 곳에 체계적으로 모아 놓은 것.
  3. DBMS: 모아 놓은 데이터를 관리하고, 사용자의 요구를 처리해주는 소프트웨어
  4. 데이터베이스 서버 : 데이터베이스/DBMS가 설치된 컴퓨터
  • 데이터베이스의 구현
  1. 물리적인 저장장치인 하드 디스크상에 구현
  2. 시스템 카탈로그 (데이터 사전) : 데이터베이스를 관리하기 위한 정보를 담고 있는 테이블
  3. 시스템 카탈로그 = 메타데이터 = 데이터베이스 스키마 = 데이터 사전
  • 데이터베이스 사용자
  1. 최종 사용자 -> 캐주얼 사용자, 초보 사용자
    1. 개주얼 사용자 -> 질의어를 이용해 매번 다른 정보를 검색
    2. 초보 사용자 -> 이미 작성된 프로그램을 통해 동일작업을 주로 반복해서 수행
  2. 응용 프로그래머
  3. 데이터베이스 관리자
  • 데이터 모델
  1. 현실세계에 존재하는 데이터, 정보를 컴퓨터 안에 표현하는 방식
  2. 사용자의 눈으로 보았을 때 데이터가 어떤 모양으로 보이게 할 것인가? ( 논리적 모델 )
  3. 데이터를 물리적으로 저장 할 때 어떻게 할 것인가? (물리적 모델)
  • 관계 데이터 모델과 제약조건!
  1. IBM 연구소 E.F. Codd가 1970년에 관계 데이터 모델을 제안함.
  2. 바탕이 되는 데이터 구조로서 간단한 테이블(릴레이션)을 사용.
  3. 중첩된 복잡한 구조가 없음
  4. 집합 위주로 데이터를 처리
  5. 숙련되지 않은 사용자도 쉽게 이해할 수 있음.
  6. 표준 데이터베이스 응용에 대해 좋은 성능을 보임
  7. 다른 데이터 모델에 비해 이론이 잘 정립되었음
  8. 관계 데이터베이스 설계와 효율적은 질의 처리 면에서 뛰어난 장점을 가짐
  • 용어
  1. 릴레이션 : 2차원의 테이블
  2. 레코드 : 릴레이션의 각 행
  3. 튜플 : 레코드를 좀 더 공식적으로 부르는 용어
  4. 애트리뷰트 : 릴레이션에서 이름을 가진 하나의 열
  5. 도메인 : 한 애트리뷰트에 나타날 수 있는 값들의 집합.
  6. 차수 : 한 릴레이션에 들어 있는 애트리뷰트들의 수
  7. 카디날리티 : 릴레이션의 튜플 수
  8. 릴레이션 스키마 : 릴레이션의 이름과 릴레이션의 애트리뷰트들의 집합
  9. 릴레이션 인스턴스 : 어느 시점에 들어있는 튜플들의 집합
  • 릴레이션의 키
  1. 슈퍼 키 : 한 릴레이션 내의 특정 튜플을 고유하게 식별하는 하나의 애트리뷰트 또는 애트리뷰트들의 집합 (유일성 o, 최소성 x)
  2. 후보 키 : 각 튜플을 고유하게 식별하는 최소한의 애트리뷰트들의 모임
  3. 복합 키 : 후보키가 두 개 이상의 애트리뷰트로 이뤄져 있을 때 (유일성 o, 최소성 o)
  4. 기본 키 : 후보 키가 두 개 이상 있으면 설계자 또는 데이터베이스 관리자가 이들 중에서 하나를 기본 키로 설정.
  5. 대체 키 : 기본 키가 아닌 후보 키
  6. 외래 키 : 어떤 릴레이션의 기본 키를 참조하는 애트리뷰트
  • 제약 조건
  1. 도메인 제약조건 : 각 애트리뷰트 값이 반드시 원자 값이어야 함.
  2. 키 제약조건 : 키 애트리뷰트에 중복된 값이 존재해서는 안됨.
  3. 기본키와 엔티티 무결성 제약조건 : 릴레이션의 기본 키를 구성하는 어떤 애트리뷰트도 널값을 가질 수 없음.
  4. 외래 키와 참조 무결성 제약조건 : 참조 무결성 제약조건은 두 릴레이션의 연관된 튜플들 사이의 일관성을 유지하는데 사용됨.
  5. 무결성 제약조건 : 갱신연산 -> 삽입, 삭제, 수정가 있는데, 이 연산 수행 시 데이터 무결성을 만족시켜야 한다.
반응형

'학교 수업 > 데이터베이스' 카테고리의 다른 글

SQL 문  (0) 2023.10.29
orders, customers, book  (0) 2023.10.18
CREATE, ALTER, DROP코드  (0) 2023.10.18