HTTP 기초개념 알아보기

반응형
728x90
반응형

HTTP (Hypertext Transfer Protocol)

웹 어플리케이션, 웹 브라우저, 서버는 모두 HTTP를 통해 서로 대화한다. HTTP는 전 세계의 웹 서버로부터 이 대량의 정보를 빠르고, 간편하고, 정확하게 사람들의 PC에 설치된 웹 브라우저로 옮겨준다. HTTP는 신뢰성 있는 데이터 전송 프로토콜을 사용하기 때문에, 데이터가 지구 반대편에서 오더라도 전송 중 손상되거나 꼬이지 않음을 보장한다.

 

 

 

웹 서버와 클라이언트

웹 콘텐츠는 웹 서버에 존재한다. 웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다. 이들 웹 서버는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다. 클라이언트는 서버에게 HTTP 요청을 보내고 서버는 요청된 데이터를 HTTP 응답으로 돌려준다. 웹 브라우저는 서버에게 HTTP 객체를 요청하고 사용자의 화면에 보여준다.

 

ex) http://www.test.com/index.html 페이지를 열어볼때, 웹 브라우저는 HTTP 요청을 www.test.com 서버로 보낸다. 서버는 요청 받은 객체(/index.html)을 찾고, 성공했다면 그것의 타입, 길이 등의 정보와 함께 HTTP 응답에 실어서 클라이언트에게 보낸다.

 

 

 

리소스

웹 서버는 웹 리소스를 관리하고 제공한다. 웹 리소스는 웹 콘텐츠의 원천이다. 어떤 종류의 콘텐츠 소스도 리소스가 될 수 있다.

 

 

 

 

미디어타입 (MIME)

인터넷은 수천가지의 데이터 타입을 다루기 때문에 HTTP는 웹에서 전송되는 객체 각각에 MIME 타입이라는 데이터 포맷 라벨을 붙인다.

 

MIME (Multipurpose Internet Mail Extenseions, 다목적 인터넷 메일 확장)은 HTTP 에서 멀티미디어 콘텐츠를 기술하고 라벨을 붙이기위해 채택되었다.

 

웹 서버는 모든 HTTP 객체 데이터에 MIME 타입을 붙인다. 웹 브라우저는 서버로부터 객체를 돌려받을때, 다룰 수 있는 객체인지 MIME 타입을 통해 확인한다.

- HTML 로 작성된 텍스트 문서 = text/html
- JPEG 이미지 = image/jpeg
- GIF 이미지 = image/gif

 

 

 

URI

웹 서버 리소스는 각자 이름을 갖고 있기 때문에, 클라이언트는 관심 있는 리소스를 지목할 수 있다. 서버 리소스 이름은 통합 지원 식별자 (uniform resource identifier), 혹은 URI 로 불린다. 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

 

URI는 아래 2가지로 분류할 수 있다.

 

1) URL
리소스 식별자의 가장 흔한 형태다. 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다. 리소스가 정확히 어디에있고 어떻게 접근할 수 있는지 분명히 알려준다.

ex) http://www.test.com/index.html
2) URN
콘텐츠를 이루는 한 리소스에 대해 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할을 한다. 리소스가 그 이름을 변경하지않는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제 없다. 실험중인 상태이고 널리 채택되지 않았다.

ex) urn:ietf:rfc:1231

 

 

 

트랜잭션

HTTP 트랜잭션은 요청 명령(클라이언트에서 서버로 보내는)과 응답 결과 (서버가 클라이언트에게 돌려주는) 로 구성되어있다. HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.

 

1) 메서드
모든 HTTP 요청 메시지는 1개의 메서드를 갖는다. 메서드는 서버에게 어떤 동작이 취해져야 하는지 말해준다. (GET, PUT, DELETE, POST, HEAD 등)

2) 상태코드
모든 HTTP 응답 메시지는 상태 코드와 함께 반환한다. (200: OK, 404 : Not Found 등)

3) 여러객체
애플리케이션은 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다. 웹페이지는 보통 하나의 리소스가 아닌 리소스의 모음이다.

4) 메시지
요청 메시지를 웹 클라이언트에서 웹 서버로 보낸 HTTP 메시지라고 하고, 응답 메시지를 웹 서버에서 클라이언트로 가는 메시지라고 한다.

 

메시지의 구조에 대해 알아보자.

  • 시작줄 : ex) HTTP/1.0 200 OK
  • 헤더 : 각 헤더 필드는 쉬운 구문분석을 위해 쌍점(:)으로 구분되어 있는 하나의 이름과 하나의 값으로 구성된다.
  • 본문 : 어떤 종류의 데이터든 들어갈 수 있는 본문이다. 요청의 본문은 웹 서버로 데이터를 실어보내고, 응답의 본문은 클라이언트로 데이터를 반환한다.

 

 

 

TCP 커넥션

HTTP 는 애플리케이션 계층 프로토콜이다. HTTP 는 네트워크 통신의 핵심적인 세부사항에 신경쓰지 않는데, 대신 대중적이로 신뢰성있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다.

 

TCP는 다음을 제공한다.

 

  1. 오류 없는 데이터 전송
  2. 순서에 맞는 전달 (데이터는 언제나 보낸 순서대로 도착한다)
  3. 조각나지않는 데이터 스트림 (언제든 어떤 크기로 보낼 수 있다)

 

TCP/IP는 TCP, IP가 층을 이루는 패킷 교환 네트워크 프로토콜의 집합이다. 각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류의 컴퓨터나 네트워크든 서로 신뢰성 있는 의사소통을 하게 해준다. TCP는 전송계층으로, HTTP 프로토콜이 TCP 위의 계층이다. HTTP 는 자신의 메시지 데이터를 전송하기 위해 TCP를 사용한다. HTTP 클라이언트가 서버에 메시지를 전송할 수 있게 되기전에, 인터넷 프로토콜(IP) 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야한다. TCP에서는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행중인 프로그램이 사용중인 포트번호가 필요하다.

 

도메인 이름 서비스 (DNS: Domain Name Service) 라 불리는 장치를 통해 www.test.com 을 207.200.83.29 와 같은 IP 주소로 변환될 수 있다.

 

웹 브라우저가 어떻게 HTTP 를 이용해서 서버의 단순한 HTML 리소스를 사용자에 보여줄 수 있는 것일까?

- 웹 브라우저는 서버의 URL에서 호스트 명을 추출한다.
- 웹 브라우저는 서버의 호스트 명을 IP로 변환한다. (DNS)
- 웹 브라우저는 URL에서 포트번호를 추출한다. (포트번호는 존재할수도, 아닐수도 있다.)
- 웹 브라우저는 웹 서버와 TCP 커넥션을 맺는다.
- 서버는 웹 브라우저는 서버에 HTTP 요청을 보낸다.
- 웹 브라우저에 HTTP 응답을 돌려준다.
- 커넥션이 닫히면 웹 브라우저는 문서를 보여준다.

 

 

 

텔넷 (Telnet)

HTTP 는 TCP/IP를 사용하고 있으며, 이진 형식이 아닌 문자열 기반이기 때문에, 웹 서버와 직접 대화하는 것도 간단하다. 텔넷은 직접 컴퓨터의 포트로 TCP 커넥션을 연결해서 그 포트로 글자를 타이핑해 넣을 수 있게 해준다. 웹 서버는 우리를 웹 클라이언트처럼 취급하고, TCP 커넥션을 통해 돌려주는 데이터는 화면에 출력된다.

 

ex) telnet www.test.com 80

 

 

 

프락시

클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다. 이 애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신에서 서버에 접근한다. 주로 보안을 위해 사용되고, 모든 웹 트래픽 흐름 속에서 신뢰할 만한 중개자 역할을 한다. 요청과 응답을 필터링한다.

 

 

 

캐시

웹 캐시와 캐시 프락시는 자신을 거쳐가는 문서들 중 자주 찾는 것의 사본을 저장해두는 특별한 종류의 HTTP 프락시 서버이다. 다음번에 클라이언트가 같은 문서를 요청하면 그 캐시가 갖고있는 사본을 받을 수 있다. 클라이언트는 멀리 떨어진 웹 서버보다 근처의 캐시에서 훨씬 더 빨리 문서를 받을 수 있다.

 

 

 

 

게이트웨이

다른 서버들의 중개자로 동작하는 특별한 서버이다. 언제나 스스로가 리소스를 갖고있는 진짜 서버인 것처럼 요청을 다룬다.

 

 

 

 

터널

두 커넥션 사이에서 날 (raw) 데이터를 열어보지않고 그대로 전달해주는 HTTP 애플리케이션이다.

 

 

반응형

'Coding > HTTP' 카테고리의 다른 글

웹 캐시에 대해 알아보기  (0) 2019.06.22
TCP 커넥션 관리  (0) 2019.06.22
HTTP 메시지  (0) 2019.06.22
URL과 리소스  (0) 2019.06.22
HTTP의 기본 인증  (0) 2019.06.22

Designed by JB FACTORY