본문 바로가기
코드잇 스프린트 6기/JS Q.R 스터디

[JS Q.R 스터디] 데이터 타입

by 학습하는 청년 2024. 4. 18.

최종 수정 : 2024-04-17

6장. 데이터 타입

값의 종류인 data type, 줄여서 '타입'이라고도 한다. 자바스크립트의 모든 값은 데이터 타입을 갖는다. 데이터 타입은 크게 원시 타입(primitive type)과 객체 타입(object/reference type)으로 분류할 수 있다.

구분 데이터 타입 설명
원시 타입 number 숫자(정수와 실수)
string 문자열
boolean 논리적 참(true)와 거짓(flase)
bigInt  
undefiend var 키워드로 선언된 변수에 암묵적으로 할당되는 값
null 값이 없다는 것을 의도적으로 명시할 때 사용하는 값
symbol  
객체 타입 객체, 함수, 배열 등

 

데이터 타입은 왜 필요할까?

값은 메모리에 저장하고 참조할 수 있어야 한다. 메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 경정해야 한다. 이때 자바스크립트 엔진은 데이터 타입에 따라 정해진 크기의 메모리 공간을 확보한다.

 

ECMAScript는 문자열(16bite)와 숫자(8bite) 타입 외의 데이터 타입의 크기를 명시적으로 규정하고 있지는 않다. ECMAScript 사양에 숫자 타입은 배정밀도 64비트 부동소수점 형식을 사용한다고 명시되어 있고, 이것은 8바이트로 표현한다.

 

또한 컴파일러 또는 인터프리터는 '심벌 테이블'이라고 부르는 자료 구조를 통해 식별자를 키로 바인딩된 값의 메모리 주소, 데이터 타입, 스코프 등을 관리한다.

 

마지막으로, 모든 값은 메모리에 2진수(비트의 나열)로 저장된다. 메모리에 저장된 값은 데이터 따라 다르게 해석될 수도 있다. 예를 들어, 메모리에 저장된 값 0100 0001을 숫자로 해석하면 65, 문자로 해석하면 'A'이다.

 

정리하면 다음과 같다.

  1. 값을 저장할 때, 확보해야 하는 메모리 공간의 크기를 결정
  2. 값을 참조할 때, 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정
  3. 메모리에서 읽어 들인 2진수를 어떻게 해석할지에 대한 결정

동적 타이핑

C나 자바 같은 정적 타입(static/strong type) 언어는 변수를 선언할 때 변수에 할당할 수 있는 값의 타입을 사전에 선언해야 한다. 이를 명시적 타입 선언(explicit type declaration)이라 한다. 정적 타입 언어는 변수의 타입을 변경할 수 없으며, 컴파일 시점에 타입체크를 수행한다. 이를 통과하지 못하면, 에러를 발생시키고 프로그램의 실행 자체를 막는다. 타입의 일관성을 강제함으로써 더욱 안정적인 코드의 구현을 통해 런타임에 발생하는 에러를 줄인다.

 

이와 달리, 자바스크립트는 동적 타입(dynamic/weak type) 언어이다. var, let, const 키워드를 사용해 변수를 선언할 뿐이다. 덕분에 어떠한 데이터 타입의 값이라도 자유롭게 할당할 수 있다. 선언이 아닌 할당에 의해 타입이 결정(타입 추론, typeinference)된다. 그리고 재할당에 의해 변수의 타입 역시 언제든지 동적으로 바뀔 수 있다. 이를 동적 타이핑(dynamic typing)이라 한다. 결국, 자바스크립트에서 변수는 타입을 갖지 않는다. 값이 타입을 갖는다. 따라서, 변수의 타입이 동적으로 결정된다고 말하는 게 옳다. 변수는 어디까지나 값에 대한 별명이기 때문이다.

 

이에 대한 문제점 역시 존재한다. 동적 타입 언어의 변수는 값을 확인하기 전에 타입을 확신할 수 없다. 심지어 자바스크립트 엔진에 의해 암묵적 형 변환이 발생하기도 한다. 유연성은 높지만 신뢰성은 떨어진다는 말이다. 따라서 변수를 사용할 때 주의할 사항은 다음과 같다.

  1. 변수는 필요한 경우에 한해 제한적으로 사용한다. 개수가 많을수록 오류가 발생할 확률도 높아진다.
  2. 스코프는 최대한 좁게 만들어 변수의 부작용을 억제해야 한다.
  3. 1번과 같은 이유에서, 전역 변수는 최대한 사용하지 않도록 한다.
  4. 변수보다는 상수를 사용해 값의 변경을 최소화한다.
  5. 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다. 명확한 네이밍은 코드를 이해하기 쉽게 만들고. 협업과 생산성 향상에 도움을 준다.
컴퓨터가 이해하는 코드는 어떤 바보도 쓸 수 있다.
하지만 훌륭한 프로그래머는 사람이 이해할 수 있는 코드를 쓴다.
- 마틴 파울러, 《리팩토링》의 저자

1. 숫자 타입

ECMAScript 사양에 따르면 숫자 타입의 값은 배정밀도 64비트 부동소수점 형식을 따른다. 즉, 모든 수를 실수로 취급하므로 자바스크립트에서는 하나의 숫자 타입만 존재한다.자바스크립트는 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 제공하지 않기 때문에 이들 값을 참조하면 모두 10진수로 해석된다.

var binary = 0b01000001; // 2진수
var octal = 0o101; // 8진수
var hex = 0x41; // 16진수

// 표기법만 다를 뿐 모두 같은 값
console.log(binary); // 65
console.log(octal); // 65
console.log(hex); // 65
console.log(binary === octal); // true
console.log(octal === hex); // true

 

숫자 타입은 특별한 값도 표현할 수 있다.

console.log(10 / 0); // Infinity
console.log(10 / -0); // -Infinity
console.log(1 * 'String'); // NaN

2. 문자열 타입

텍스트 데이터를 나타내는 데 사용하며, 작은따옴표(' '), 큰따옴표(" ") 또는 백틱(` `)으로 텍스트를 감싼다. 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다. 그렇지 않으면, 자바스크립트 엔진은 키워드나 식별자 같은 토큰으로 인식한다. 또한 스페이스와 같은 공백 문자도 포함시킬 수 없다.

 

자바스크립트의 문자열은 원시 타입이며, 변경 불가능한 값(immutable value)이다. 후에, 문자열은 유사 배열이라 순회가 가능하다. 그러나 요소의 값은 변경할 수 없음을 말하기 위해 변경 불가능한 값이라고 언급한다.

 

템플릿 문자열(template literal)

멀티라인 문자열(multi-line string), 표현식 삽입(expression interpolation), 태그드 템플릿(tagged template) 등 편리한 문자열 처리 기능을 제공한다. 런타임에 일반 문자열로 변환되어 처리되며, 백틱(` `)을 사용해 표현한다.

 

일반 문자열에서는 줄바꿈(개행)이 허용되지 않아 이스케이프 시퀀스(escape sequence)를 사용해야 한다. 또한 공백을 표현하기 위해서는 따옴표 안에 공백을 하나둬야 했다. 문자열 연산자 +를 통해 연결하는 불편함도 있다. 그러나 템플릿 문자열을 사용하면 훨씬 편해진다.

// 자유로운 개행이 가능하며, 이스케이프를 사용하지 않아도 된다.
var template = `<ul>
  <li><a href="#">Home</a></li>
</ul>`;

// 문자열 연산자 +를 사용하지 않아도 공백이나 연결이 가능하다.
var first = 'Yeongtaek';
var last = 'Oh';

console.log(`My name is ${first} ${last}.`);

표현식을 삽입하려면 ${}으로 표현식을 감싼다. 문자열이 아니더라도 문자열로 타입이 강제로 변환되어 삽입된다.


3. 불리언 타입

값은 논리적 참, 거짓을 나타내는 true, false뿐이다. 조건문에서 자주 사용된다.


4. undefined 타입

값은 undefined 뿐이다.

 

var 키워드로 선언한 변수는 암묵적으로 undefined로 초기화된다. 또한 변수를 선언한 이후 값을 할당하지 않은 변수를 참조하면 undefined가 반환된다. 즉, 자바스크립트 엔진이 변수를 초기화할 때 사용하는 값이다. 만약, 개발자가 undefuned를 의도적으로 변수에 할당한다면 본래 취지와 어긋날뿐더러 혼란을 줄 수 있으므로 권장하지 않는다.

 

선언(declaration)과 정의(definition)

undefined를 직역하면 '정의되지 않은'이다. 다른 프로그래밍 언어에서는 컴파일러에게 식별자의 존재만 알리는 것은 선언이고, 실제로 컴파일러가 변수를 생성해서 식별자와 메모리 주소가 연결되면 정으로 구분한다. 자바스크립트의 경우 변수를 선언하면 암묵적으로 정의가 이뤄지기 때문에 선언과 정의의 구분이 모호하다.

ECMAScript 사양에서는 변수는 '선언한다'라고 표현하고, 함수는 '정의한다' 라고 표현한다.

5. null 타입

값은 null이 유일하며, 변수에 값이 없다는 것을 의도적으로 명시(의도적 부재, intertional absence)할 때 사용한다. 변수에 null은 할당한다는 것은 참조를 명시적으로 제거하는 것을 의미하며, 자바스크립트 엔진도 가비지 콜렉션을 수행하도록 유도한다.

 

함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다.

var element = document.querySelector('.myClass');

console.log(element); // null

6. 심벌 타입

ES6에서 추가된 7번째 타입, 원시 타입의 값이다. 다른 값과 중복되지 않는 유일무이한 값이며 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다.

 

심벌 이외의 원시 값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해 생성한다. 이때 생성된 심벌 값은 외부에 노출되지 않으며, 유일무이한 값이다.

// 심벌 값 생성
var key = Symbol('key');
console.log(typeof key); // Symbol

// 객체 생성
var obj = {};

// 프로퍼티 키로 사용
obj[key] = 'value';
console.log(obj[key]); // value

7. bigInt 타입

추가 예정


8. 객체 타입

데이터 타입은 크게 원시 타입과 객체 타입으로 분류된다. 그 이유는 근본적으로 다르기 때문이다.

 

자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있는 거의 모든 것이 객체라고 말해도 과언이 아니다.

(추후 링크 연결 - 배열 / 함수 / 객체)


참고 자료

모던 자바스크립트 Deep Dive (p.59-73)

댓글