[HTTP] 7. HTTP 헤더1 - 일반 헤더

업데이트:
7 분 소요


김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 듣고 정리했습니다.


(1) HTTP 헤더 개요

HTTP 헤더

  • header-field = field-name:OWS field-value OWS (OWS:띄어쓰기 허용)
  • field-name은 대소문자 구문 없음

http

용도

  • HTTP 전송에 필요한 모든 부가정보가 담겨있다.
  • 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보…
  • 표준 헤더는 굉장히 많이 있고, 필요시 임의의 헤더를 추가할 수 있다.

분류 - RFC2616(과거)

http

  • General 헤더: 메시지 전체에 적용되는 정보, 예) Connection: close
  • Request 헤더: 요청 정보, 예) User-Agent: Mozilla/5.0 (Macintosh; ..)
  • Response 헤더: 응답 정보, 예) Server: Apache
  • Entity 헤더: 엔티티 바디 정보, 예) Content-Type: text/html, Content-Length: 3423

HTTP BODY

message body - RFC2616(과거)

http

  • 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는 데 사용된다
  • 엔티티 본문은 요청이나 응답에서 전달하는 실제 데이터이다.
  • 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보를 제공한다.
    • 데이터 유형(html, json), 데이터 길이, 압축 정보 등

RFC723x 변화

  • 엔티티(Entity) → 표현(Representation)
  • Representation = representation Metadata + Representation Data
  • 표현 = 표현 메타데이터 + 표현 데이터

message body - RFC7230(최신)

http

  • 메시지 본문(message body)을 통해 표현 데이터를 전달한다.
  • 메시지 본문 = 페이로드(payload)
  • 표현은 요청이나 응답에서 전달할 실제 데이터이다.
  • 표현 헤더는 표현 데이터를 해석할 수 있는 정보를 제공한다.
    • 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
  • 참고: 표현 헤더는 표현 메타데이터와 페이로드 메시지를 구분해야 한다.

(2) 표현

http

  • Content-Type: 표현 데이터의 형식
    • 예) HTML, JSON, XML
  • Content-Encoding: 표현 데이터의 압축 방식
  • Content-Language: 표현 데이터의 자연 언어
  • Content-Length: 표현 데이터의 길이
  • 표현 헤더는 전송, 응답에 둘 다 사용한다.

Content-Type

표현 데이터의 형식 설명

http

  • content body에 들어가는 내용이 무엇인지 알려준다.
  • 미디어 타입, 문자 인코딩
  • 예)
    • text/html; charset=utf-8
    • application/json
    • image/png

Content-Encoding

표현 데이터 인코딩

http

  • 표현 데이터를 압축하기 위해 사용한다.
  • 데이터를 전달하는 곳에서압축 후 인코딩 헤더를 추가한다.
  • 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축을 해제한다.
  • 예)
    • gzip
    • deflate
    • identity

Content-Language

표현 데이터의 자연 언어

http

http

  • 표현 데이터의 자연 언어를 표현한다.
  • 예)
    • ko
    • en
    • en-US
  • 다국적 기업의 사이트에서는 다양한 언어를 지원하는데, 이때 사용한다.

Content-Length

표현 데이터의 길이

http

  • 표현 데이터의 길이는 바이트 단위로 표현한다.
  • Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안된다.

(3) 콘텐츠 협상

협상(콘텐츠 네고시에이션)

클라이언트가 선호하는 표현 요청

  • Accept: 클라이언트가 선호하는 미디어 타입 전달
  • Accept-Charset: 클라이언트가 선호하는 문자 인코딩
  • Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
  • Accept-Language: 클라이언트가 선호하는 자연 언어
  • 협상 헤더는 요청시에만 사용

Accept-Language

Accept-Language 적용 전

  • 한국어 브라우저에서 다중 언어를 지원하는 서버에 접속한다. 서버에서는 기본적으로 영어를 지원하기 때문에 영어로 응답한다. 클라이언트가 어떤 언어를 선호하는지 정보가 없기 때문이다.

http

**Accept-Language 적용 전

  • 클라이언트가 서버에 요청을 하면서, 선호하는 언어 정보를 보낸다. 서버의 기본 언어는 영어지만, 클라이언트가 원하는 언어(한국어)를 지원하기 때문에 선호 언어로 응답한다.

http

Accept-Language 복잡한 예시

  • 클라이언트가 선호하는 언어는 한국어지만, 다중 언어 지원 서버는 독일어를 기본으로 한다. 그리고 영어를 지원하는 상황이다. 클라이언트가 선호하는 언어 1가지만 명시하여 요청을 하고 서버에서 그 언어를 지원하지 않는다면, 서버는 기본 언어(독일어)로 응답한다.

http

협상과 우선순위1

Quality Values(q) 값을 사용한다.

http

  • 0~1 까지의 수를 사용하는데, 값이 클수록 우선 순위가 높다.
    • 0이 우선순위가 가장 낮다.
    • 1이 우선순위가 가장 높다.

Accept-Language 복잡한 예시

  • 클라이언트는 한국어를 가장 선호하지만, 그 다음으로는 영어를 선호한다. 서버는 한국어를 지원하지 않는다. 이런 상황에서 서버는 서버의 기본 언어인 독일어로 응답하지 않고, 클라이언트가 2번째로 선호하는 영어로 응답한다.

http

Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
  1. ko-KR;q=1 (q생략)

  2. ko;q=0.9

  3. en-US;q=0.8

  4. en:q=0.7

협상과 우선순위2

구체적인 것이 우선한다.

http

Accept: text/*, text/plain, text/plain;format=flowed, */*
  1. text/plain;format=flowed

  2. text/plain

  3. text/*

  4. */*

협상과 우선순위3

구체적인 것을 기준으로 미디어 타입을 맞춘다.

Accept: text/*;q=0.3, text/html;q=0.7, text/html;level=1, text/html;level=2;q=0.4, */*;q=0.5
  • text/plain의 경우 딱 맞는 기준이 없으므로, text/*에 맞춰 0.3이 된다.

http

(4) 전송 방식

단순 전송

Content-Length

  • 컨텐트의 길이를 정확하게 알고 있을 때 사용한다. 한 번에 요청하고 한 번에 받는다.

http

압축 전송

Content-Encoding

  • 서버에서 콘텐트를 전달할 때 압축하여 전달한다. 이때, 어떻게 압축되어 있는지 정보를 함께 전달한다. 압축 전송 방식으로 전송하면 Content-Length를 줄일 수 있다.

http

분할 전송

Transfer-Encoding

  • chuncked는 덩어리로 보낸다는 의미이다. 서버에서 데이터를 분할하는데, 각 덩어리의 바이트 정보를 함께 전송한다. 클라이언트에서는 데이터가 다 도착하기를 기다리지 않고, 데이터를 받는대로 바로바로 처리한다. /r/n은 끝이라는 표시이다.
  • 분할 전송 방식에서는 Content-Length를 표시하면 안된다. Cotnent-Length를 예측할 수도 없다.

http

범위 전송

Range, Content-Range

  • 데이터를 전송하는데, 중간에 클라이언트와 서버의 연결이 끊겼다고 가정한다. 이런 상황에서 클라이언트는전송받지 못한 부분의 범위를 지정하여 전송을 요청할 수 있다.

http

(5) 일반 정보

From

유저 에이전트의 이메일 정보

  • 일반적으로 잘 사용되지는 않는다.
  • 검색 엔진 같은 곳에서 주로 사용한다.
  • 요청에서 사용한다.

Referer

이전 웹 페이지 주소

  • 현재 요청된 페이지의 이전 웹 페이지 주소를 의미한다.
  • A → B로 이동하는 경우, B를 요청할 때 Referer: A를 포함하여 요청한다.
  • Referer를 사용해서 유입 경로를 분석할 수 있다.
  • 요청에서 사용한다.
  • 참고 : referer는 단어 referrer의 오타

User-Agent

유저 에이전트 애플리케이션 정보

  • 클리이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/ 537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
  • 통계 정보를 얻을 수 있다.
    • 사용자들이 어떤 브라우저를 사용하는지 알 수 있다.
    • 어떤 종류의 브라우저에서 장애가 발생하는지 파악할 수 있다.
  • 요청에서 사용한다.

Server

요청을 처리하는 ORIGIN 서버의 소프트웨어 정보

  • 사용자의 요청이 최종적으로 도착하는 서버(응답하는 서버)를 origin 서버라 한다. HTTP 요청을 보내면 중간에 여러 proxy 서버를 거치는데, 이런 서버들은 origin 서버가 아니다.
Server: Apache/2.2.22 (Debian)
server: nginx
  • 응답에서 사용한다.

Date

메시지가 발생한 날짜와 시간

Date: Tue, 18 May 2021 08:12:31 GMT
  • 응답에서 사용한다.

(6) 특별한 정보

Host

요청한 호스트 정보(도메인)

  • 요청에서 사용하는 필수 값이다.
  • 하나의 서버가 여러 도메인을 처리해야 할 때, 즉 하나의 IP 주소에 여러 도메인이 적용되 있을 때 호스트를 구분하기 위해 필요하다.
  • 가가상호스트를 통해 여러 도메인을 한번에 처리할 수 있는 서버에서는 실제 애플리케이션이 여러개 구동될 수 있다. 클라이언트에서 어떤 호스트에 요청을 하는지 명시하지 않고 요청을 보낸다면, 서버 입장에서는 어떤 사이트로 요청을 보내야하는지 알 수 없다.

http

  • 요청 메시지에 Host 정보를 추가하여 요청을 보내면, 서버에서는 이를 처리할 수 있다.

http

Location

페이지 리다이렉션

  • 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동으로 이동한다. (리다이렉트)
  • 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI를 의미한다.
  • 3xx (Redirection): Location 값은 요청을 자동으로 리다이렉션하기 위한 대상 리소스를 가리킨다.

Allow

허용 가능한 HTTP 메서드

  • 서버에서 어떤 HTTP 메서드를 지원하는지 클라이언트에게 알려준다.
  • 405 (Method Not Allowed)에서 응답에 포함해야 한다.
Allow: GET, HEAD, PUT

Retry-After

유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간

  • 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있다.
  • 날짜를 표기할 수 있다.
Retry-After: Fri, 31 Dec 1999 23:59:59 GMT
  • 초단위로 표기할 수 있다.
Retry-After: 120
  • 실제로 사용하기는 쉽지 않다.

(7) 인증

Authorization

클라이언트 인증 정보를 서버에 전달

Authorization: Basic xxxxxxxxxxxxxxxx
  • 인증하는 메커니즘은 여러가지가 있는데, 어떤 메커니즘인지에 따라 value값이 달라진다.
  • 어떤 인증 메커니즘인지에 상관없이 헤더에 인증 정보를 제공한다.

WWW-Authenticate

리소스 접근시 필요한 인증 방법 정의

WWW-Authenticate: Newauth realm="apps", type=1, 
				  title="Login to \"apps\"", Basic realm="simple"
  • 리소스에 접근을 시도했는데 접근 방법이 맞지 않는다면, 401 오류가 발생한다. 401 Unauthorized 응답과 함께 사용한다.

(8) 쿠키

  • Set-Cookie: 서버에서 클라이언트로 쿠키를 전달한다. (응답)
  • Cookie: 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달한다.

쿠키 미사용

처음 welcome 페이지 접근사용

  • 웹브라우저에 클라이언트가 접속하면 /welcome 요청을 보내고, 서버는 이에 응답한다.

http

로그인

  • 사용자가 로그인을 하면 /login 요청을 보내고, 서버는 이에 응답한다.

http

로그인 이후 welcom 페이지 접근

  • 사용자는 로그인을 했기 때문에, 서버가 ‘안녕하세요, 홍길동님!’이라고 응답할 것을 기대할 것이다. 하지만 쿠키를 사용하지 않으면, 서버는 로그인 정보를 제공받지 못하기 때문에 ‘안녕하세요 손님!’이라고 응답한다.

http

Stateless

  • HTTP는 무상태(stateless) 프로토콜이다.
  • 클라이언트와 서버가 요청과 응답을 주고 받고 나면 연결이 끊어진다.
  • 클라이언트가 다시 요청하면 서버는 이전 요청을 기억하지 못한다.
  • 클라이언트와 서버는 서로 상태를 유지하지 않는다.

쿠키 미사용 대안

모든 요청에 사용자 정보 포함

  • 모든 요청에 user의 정보를 서버에 전송한다.

http

  • 모든 요청과 링크에 사용자 정보를 포함한다면, 보안에도 문제도 있을 것이고 개발자는 이를 이를 고려하여 개발을 해야 한다. 또한 브라우저를 완전히 종료하고 다시 실행한다면 어떻게 할 것인지도 개발자 입장에서 부담이 된다.

http

쿠키 사용

로그인

  • 웹브라우저에서 로그인을 하면, 서버에서 응답을 할 때 Set-Cookie 헤더에 user의 정보를 함께 담아 응답한다. 웹 브라우저 내부에는 쿠키 저장소가 있다. 그 저장소에 서버가 응답 메시지에 보낸 쿠키 정보를 저장한다.

http

로그인 이후 welcome 페이지 접근

  • 웹브라우저는 요청을 보낼 때마다 쿠키 저장소에 있는 정보를 조회하여 Cookie 헤더에 함께 보낸다. 지저분하게 쿼리파라미터를 사용하여 URL에 user의 정보를 보내지 않아도 된다.

http

모든 요청에 쿠키 정보 자동 포함

  • 요청에 필요한 정보를 URL에 모두 포함할 필요가 없다.

http

쿠키

  • 쿠키를 서버에서 세팅할 때, set-cookie 헤더를 이용한다.
set-cookie: sessionId=abcde1234; expires=Sat, 26-Dec-2020 00:00:00 GMT; path=/; domain=.google.com; Secure
  • 사용처
    • 사용자 로그인 세션 관리
    • 광고 정보 트래킹

쿠키는 세팅하고 나면 무조건 서버에 전송된다.

  • 쿠키 정보는 항상 서버에 전송된다.
    • 네트워크 트래픽 추가 유발한다.
    • 최소한의 정보만 사용하는 것이 좋다. (세션 id, 인증 토큰 정도)
    • 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage)를 이용한다.
  • 주의) 보안에 민감한 데이터는 절대 저장하면 안된다. (주민번호, 신용카드 번호 등)

쿠키 생명주기

Expires, max-age

  • 날짜 단위로 쿠키를 지정할 수 있다. 만료일이 되면 쿠키가 삭제된다.
Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
  • 초단위로 쿠키를 지정할 수 있다. 0이나 음수를 지정하면 쿠키가 삭제된다.
Set-Cookie: max-age=3600 (3600초)
  • 세션 쿠키: 만료 날짜를 생략하면 브라우저 종료시 까지만 유지된다.
  • 영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지된다.

쿠키 도메인

Domain

  • 특정 도메인에서만 쿠키를 사용하도록 지정할 수 있다.
domain=example.org
  • 명시: 명시한 문서 기준 도메인 + 서브 도메인 포함
    • domain=example.org를 지정해서 쿠키 생성한다면, example.org는 물론이고 dev.example.org도 쿠키에 접근할 수 있다.
  • 생략: 현재 문서 기준 도메인만 적용된다.
    • example.org 에서 쿠키를 생성하고 domain 지정을 생략한다면, example.org 에서만 쿠키에 접근할 수 있다. dev.example.org는 쿠키에 접근할 수 없다.

쿠키 경로

Path

  • 특정 경로를 포함한 하위 경로 페이지만 쿠키에 접근할 수 있도록 지정할 수 있다.
path=/home
  • 일반적으로 path=/ 루트로 지정한다.
  • 예) path=/home 지정
    • /home → 가능
    • /home/level1 → 가능
    • /home/level1/level2 → 가능
    • /hello → 불가능

쿠키 보안

Secure, HttpOnly, SameSite

  • Secure
    • 쿠키는 http, https를 구분하지 않고 전송한다.
    • Secure를 적용하면 https인 경우에만 전송한다.
  • HttpOnly
    • XSS 공격 방지
    • 자바스크립트에서 쿠키 접근이 불가(document.cookie)하게 한다. (원래는 가능)
    • HTTP 전송에만 사용한다.
  • SameSite
    • XSRF 공격 방지
    • 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키를 전송한다.

태그:

카테고리:

업데이트: