본문 바로가기

자격증/빅데이터분석기사

스키마, JSON, XML

반응형

데이터의 유형

데이터의 유형에는 정형 데이터, 반정형 데이터, 비정형 데이터가 존재하는데, 그 중 반정형 데이터에 대해 알아보자.

 

반정형 데이터 (Semi-structed Data)

반정형 데이터는 데이터의 형식과 구조가 비교적 유연하고, 스키마! 정보를 데이터와 함께 제공하는 파일 형식의 데이터를 말합니다. 연산이 불가능한 것이 특징입니다.

 

스키마

스키마는 자료의 구조, 표현 방법을 의미하는데, 다음과 같은 것들이 스키마가 될 수 있다.

1. JSON

2. XML

위 두 가지는 API 통신 과정 중 자주 사용되는 데이터 표현 방식이다.

 

JSON (JavaScript Object Notation)

JSON은 속성-값 (attribute-value)를 한 쌍으로 이용되는 키-값 쌍으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 표준 포맷을 말합니다.

- 한 예로 다음과 같이 한 사람에 관한 정보를 갖는 JSON을 작성할 수 있다.

 

{
    "이름": "홍길동",
    "나이": 55,
    "성별": "남",
    "주소": "서울특별시 양천구 목동",
    "특기": ["검술", "코딩"],
    "가족관계": {"#": 2, "아버지": "홍판서", "어머니": "춘섬"},
    "회사": "경기 수원시 팔달구 우만동"
 }

 

XML (eXtensible Markup Language)

XML은 W3C (World Wide Web Consortium)에서 개발된, 다른 특수한 목적을 갖는 마크업 언어를 만드는데  사용하도록 권장하는 다목적 마크업 언어입니다. 

 

XML은 HTML과 비교해 보자면, 사용자가 직접 태그를 만들기 때문에, 데이터의 구조를 좀 더 명확하게 볼 수 있습니다.

 

<?xml version="1.0" encoding="UTF-8"?>
<연락처>
	<이름>홍길동</이름>
    <전화번호>010-1234-5678</전화번호>
</연락처>
반응형