熱心網友
傳輸控制協議(Transmission Control Protocol, TCP)TCP協議主為了在主機間實現高可靠性的包交換傳輸協議。本文將描述協議標準和實現的一些方法。因為計算機網絡在現代社會中已經是不可缺少的了,TCP協議主要在網絡不可靠的時候完成通信,對軍方可能特別有用,但是對于政府和商用部門也適用。TCP是面向連接的端到端的可靠協議。它支持多種網絡應用程序。TCP對下層服務沒有多少要求,它假定下層只能提供不可靠的數據報服務,它可以在多種硬件構成的網絡上運行。下面的圖是TCP在層次式結構中的位置,它的下層是IP協議,TCP可以根據IP協議提供的服務傳送大小不定的數據,IP協議負責對數據進行分段,重組,在多種網絡中傳送。TCP的上面就是應用程序,下面是IP協議,上層接口包括一系列類似于操作系統中斷的調用。對于上層應用程序來說,TCP應該能夠異步傳送數據。下層接口我們假定為IP協議接口。為了在并不可靠的網絡上實現面向連接的可靠的傳送數據,TCP必須解決可靠性,流量控制的問題,必須能夠為上層應用程序提供多個接口,同時為多個應用程序提供數據,同時TCP必須解決連接問題,這樣TCP才能稱得上是面向連接的,最后,TCP也必須能夠解決通信安全性的問題。網絡環境包括由網關(或其它設備)連接的網絡,網絡可以是局域網也可以是一些城域網或廣域網,但無論它們是什么,它們必須是基于包交換的。主機上不同的協議有不同的端口號,一對進程通過這個端口號進行通信。這個通信不包括計算機內的I/O操作,只包括在網絡上進行的操作。網絡上的計算機被看作包傳送的源和目的結點。特別應該注意的是:計算機中的不同進程可能同時進行通信,這時它們會用端口號進行區別,不會把發向A進程的數據由B進程接收的。進程為了傳送數據會調用TCP,將數據和相應的參數傳送給TCP,于是TCP會將數據傳送到目的TCP那里,當然這是通過將TCP包打包在IP包內在網絡上傳送達到的。接收方TCP在接收到數據后會通信上層應用程序,TCP會保證接收數據順序的正確性。雖然下層協議可能不會保證順序是正確的。這里需要說明的是網關在接收到這個包后,會將包解開,看看是不是已經到目的地了,如果沒有到,應該走什么路由達到目的地,在決定后,網關會根據下一個網絡內的協議情況再次將TCP包打包傳送,如果需要,還要把這個包再次分成幾段再傳送。這個落地檢查的過程是一個耗時的過程。從上面,我們可以看出TCP傳送的基本過程,當然具體過程可能要復雜得多。在實現TCP的主機上,TCP可以被看成是一個模塊,和文件系統區別不大,TCP也可以調用一些操作系統的功能,TCP不直接和網絡打交道,控制網絡的任務由專門的設備驅動模塊完成。TCP只是調用IP接口,IP向TCP提供所有TCP需要的服務。通過下圖我們可以更清楚地看到TCP協議的結構。上面已經說過了,TCP連接是可靠的,而且保證了傳送數據包的順序,保證順序是用一個序號來保證的。響應包內也包括一個序列號,表示接收方準備好這個序號的包。在TCP傳送一個數據包時,它同時把這個數據包放入重發隊列中,同時啟動記數器,如果收到了關于這個包的確認信息,將此包從隊列中刪除,如果計時超時則需要重新發送此包。請注意,從TCP返回的確認信息并不保證最終接收者接收到數據,這個責任由接收方負責。每個用于傳送TCP的通道都有一個端口標記,因為這個標記是由每個TCP終端確定的,因此TCP可能不唯一,為了保證這個數值的唯一,要使用網絡地址和端口號的組合達到唯一標識的目的,我們稱這個為了套接字(Socket),一個連接由連接兩端的套接字標識,本地的套接字可能和不同的外部套接字通信,這種通信是全雙工的。通過向本地端口發送OPEN命令及外部套接字參數建立連接,TCP返回一個標記這個連接的名稱,以后如果用戶需要使用這個名稱標記這個連接。為了保存這個連接的信息,我們假設有一個稱為傳輸控制塊(Transmission Control Block,TCB)的東西來保存。OPEN命令還指定這個連接的建立是主動請求還是被動等待請求。下面我們要涉及具體的功能了,TCP段以internet數據報的形式傳送。IP包頭傳送不同的信息域,包括源地址和目的地址。TCP頭跟在internet包頭后面,提供了一些專用于TCP協議的信息。下圖是TCP包頭格式圖:源端口:16位;目的端口:16位序列碼:32位,當SYN出現,序列碼實際上是初始序列碼(ISN),而第一個數據字節是ISN+1; 確認碼:32位,如果設置了ACK控制位,這個值表示一個準備接收的包的序列碼;數據偏移量:4位,指示何處數據開始;保留:6位,這些位必須是0;控制位:6位;窗口:16位; 校驗位:16位;優先指針:16位,指向后面是優先數據的字節;選項:長度不定;但長度必須以字節記;選項的具體內容我們結合具體命令來看;填充:不定長,填充的內容必須為0,它是為了保證包頭的結合和數據的開始處偏移量能夠被32整除; 我們前面已經說過有一個TCB的東西了,TCB里有存儲了包括發送方,接收方的套接字,用戶的發送和接收的緩沖區指針等變量。除了這些還有一些變量和發送接收序列號有關:發送序列變量SND。UNA - 發送未確認SND。NXT - 發送下一個SND。WND - 發送窗口SND。UP - 發送優先指針SND。WL1 - 用于最后窗口更新的段序列號SND。WL2 - 用于最后窗口更新的段確認號ISS - 初始發送序列號 接收序列號RCV。NXT - 接收下一個RCV。WND - 接收下一個RCV。UP - 接收優先指針IRS - 初始接收序列號下圖會幫助您了解發送序列變量間的關系: 當前段變量SEG。SEQ - 段序列號SEG。ACK - 段確認標記SEG。LEN - 段長SEG。WND - 段窗口SEG。UP - 段緊急指針SEG。PRC - 段優先級連接進程是通過一系列狀態表示的,這些狀態有:LISTEN,SYN-SENT,SYN-RECEIVED,ESTABLISHED,FIN-WAIT-1,FIN-WAIT-2,CLOSE-WAIT,CLOSING,LAST-ACK,TIME-WAIT和 CLOSED。CLOSED表示沒有連接,各個狀態的意義如下:LISTEN - 偵聽來自遠方TCP端口的連接請求;SYN-SENT - 在發送連接請求后等待匹配的連接請求; SYN-RECEIVED - 在收到和發送一個連接請求后等待對連接請求的確認; ESTABLISHED - 代表一個打開的連接,數據可以傳送給用戶;FIN-WAIT-1 - 等待遠程TCP的連接中斷請求,或先前的連接中斷請求的確認;FIN-WAIT-2 - 從遠程TCP等待連接中斷請求;CLOSE-WAIT - 等待從本地用戶發來的連接中斷請求;CLOSING - 等待遠程TCP對連接中斷的確認;LAST-ACK - 等待原來發向遠程TCP的連接中斷請求的確認;TIME-WAIT - 等待足夠的時間以確保遠程TCP接收到連接中斷請求的確認; CLOSED - 沒有任何連接狀態;TCP連接過程是狀態的轉換,促使發生狀態轉換的是用戶調用:OPEN,SEND,RECEIVE,CLOSE,ABORT和STATUS;傳送過來的數據段,特別那些包括以下標記的數據段SYN,ACK,RST和FIN;還有超時,上面所說的都會時TCP狀態發生變化。 下面的圖表示了TCP狀態的轉換,但這圖中沒有包括錯誤的情況和錯誤處理,不要把這幅圖看成是總說明了。 3。3。 序列號請注意,我們在TCP連接中發送的字節都有一個序列號。因為編了號,所以可以確認它們的收到。對序列號的確認是累積性的,也就是說,如果用戶收到對X的確認信息,這表示在X以前的數據(不包括X)都收到了。在每個段中字節是這樣安排的:第一個字節在包頭后面,按這個順序排列。我們需要認記實際的序列空間是有限的,雖然很大,但是還是有限的,它的范圍是0到2的32次方減1。我想熟悉編程的一定知道為什么要在計算兩個段是不是相繼的時候要使用2的32次方為模了。TCP必須進行的序列號比較操作種類包括以下幾種:(a) 決定一些發送了的但未確認的序列號; (b) 決定所有的序列號都已經收到了;(c) 決定下一個段中應該包括的序列號。對于發送的數據TCP要接收確認,處理確認時必須進行下面的比較操作:SND。UNA = 最老的確認了的序列號;SND。NXT = 下一個要發送的序列號;SEG。ACK = 接收TCP的確認,接收TCP期待的下一個序列號; SEG。SEQ = 一個數據段的第一個序列號;SEG。LEN = 數據段中包括的字節數;SEG。SEQ+SEG。LEN-1 = 數據段的最后一個序列號。請注意下面的關系:SND。UNA 0 RCV。NXT =0 0 不可接受 0 0 RCV。NXT = B SYN 本方序列號是X 2) A B ACK 確認對方序列號上面的第2步和第3步可以合并,這時可以成為3階段,所以我們可以稱它為三消息握手。這個過程是必須的,因為序列號不和全局時鐘關聯,TCP也可以有不同的機制選擇ISN。接收到第一個SYN的接收方不可能知道這個數據段是不是被延時,除非它記住了在連接上使用的最近的序列號(這通常是不可能的),因此它必須要求發送者確認。為了保證TCP獲得的確認是剛才發送的段產生的,而不是仍然在網絡中的老數據段產生的,因此TCP必須在MSL時間之內保持沉默。在本文中,我們假設MSL=2小時,這是出于工程的需要,如果用戶覺得可以,他可以改變MSL。請注意如果TCP重新初始化,而內存中的序列號正在使用,不需要等待,但必須確認使用的序列號比當前使用的要大。如果一臺主機在未保留任何序列號的情況下失敗,那么它應該在MSL時間之內不發出任何數據段。下面將會這一情況進行說明。TCP的實現可以不遵守這個規定,但是這會造成老數據被當成新數據接收,而新數據被當成老數據拒絕的情況。每當數據段形成并進入輸出隊列,TCP會為它指定序列空間中的一個值。TCP中多復本檢測和序列算法都依賴于這個地址空間,在對方發送或接收之前不會超過2的32次方個包存在于輸出隊列中。所有多余的數據段都會被刪除。如果沒有這個規定,會出現多個數據段被指定同一個序列號的情況,會造成混亂。數據段中序列號的多少和數據段中的字節數一樣多。在通常情況下,TCP保留下一個要發送的序列號和還未確認的最老的序列號,不要在沒有確認的時候就再次使用,這樣會有些風險,也正是因為這樣的目的,所以序列空間很大。對于2M的網絡,要4。5小時來耗盡序列空間,因為一個數據段可能的最大生存時間也不過十幾分之一秒,這就留下了足夠的空間;而在100M的網絡上需要5。4分鐘,雖然少了點,但也可以了。如果在實現TCP時沒有為保存序列號留下空間,那清除多余的包可能就不能實現了,因此推薦這種類型的TCP實現最好在失敗后等待MSL時間,這樣保證多余的包被刪除。這種情況有時候也可能會出現在保留序列號的TCP實現中。如果TCP在選擇一個另一個TCP連接正在使用的序列號時,這臺主機突然失敗了,這就產生了問題。這個問題的實質在于主機不知道它失敗了多久,也不知道多余的復本是不是還在網絡中。處理這種問題的方法是等待MSL時間,如果不這樣就要冒著對方錯誤接收數據的危險,要等待的時間也就稱為“沉默時間”。實現者可以讓用戶選擇是不是等待,但是無論用戶如何也不見得非要等待MSL時間。3。4。 建立一個連接建立連接應用的是三消息握手。如果雙方同時都發送SYN也沒有關系,雙方會發現這個SYN中沒有確認,于是就知道了這種情況,通常來說,應該發送一個"reset"段來解決這種情況。三消息握手減少了連接失敗的可能性。下面就是一個例子,在尖括號是的就是數據段中的內容和標記。其它的就不多說了。在第2行,TCP A發送SYN初始化序列號,表示它要使用序列號100;第3行中,TCP B給出確認,并且期待著A的帶有序列號101的數據段;第4行,TCP A給出確認,而在第5行,它也給出確認,并發送了一些數據,注意第4行的序列號與第5號的一樣,因為ACK信息不占用序列號空間內的序列號。同時產生請求的情況如下圖所示,只復雜一點。使用三消息握手的主要原因是為了防止使用過期的數據段。為了這個目的,必須引入新的控制消息,RESET。如果接收TCP處理非同步狀態,在接收到RESET后返回到LISTEN狀態。如果TCP處理下面幾種狀態ESTABLISHED,FIN-WAIT-1,FIN-WAIT-2,CLOSE-WAIT,CLOSING,LAST-ACK,TIME-WAIT時,放棄連接并通過用戶。我們下面就詳細說明后一種情況。通過上面的例子,我們可以看出TCP連接是如何從過期數據段的干擾下恢復的。請注意第4行和第5行中的RST(RESET信號)。半開連接和其它非正常狀態如果一方在未通過另一方的情況下關閉連接,或雙方雖然失敗而不同步的情況我們稱為半開連接狀態。在一方試圖發送數據時連接會自動RESET。然而這種情況畢竟屬于不正常情況。應該做出相應的處理。如果A處的連接已經關閉,B處并不知道。當B希望發送數據到A時,就會收到RESET信號,表示這個TCP連接有誤,要中止當前連接。假設A和B兩個進程相互通信的時候A的TCP發生了失敗,A依靠操作系統支持TCP的存在,通常這種情況下會有恢復機制起作用,當TCP重新恢復的時候,A可能希望從恢復點開始工作。這樣A可能會試圖OPEN連接,然后在這個它認為還是打開的連接上傳送數據,這時A會從本地(也就是A的)TCP上獲得錯誤消息“未打開連接”。A的TCP將發送包括SYN的數據段。下面的例子將顯示這一過程:上面這個例子中,A方收到的信息并沒有確認任何東西,這時候A發現出了問題,于是發送了RST控制信息。另一種情況是發生在A失敗,而B方仍然試圖發送數據時,下面的例子可以表示這種情況,請注意第2行中A對B發送來的信息不知所云。在下面的例子中,A方和B方進行的被動連接,它們都在等待SYN信息。過期的包傳送到B方使B回應了,而收到回應的A卻發現不對頭,傳送RST控制信息,B方返回被動LISTEN狀態。現實中的情況太多了,我們列舉一些產生RST控制信息的規則如下:通常情況下,RST在收到的信息不是期待的信息時產生。如果在不能確定時不要輕易發送RST控制信息。下面有三類情況:如果連接已經不存在,而發送來的消息又不是RST,那么要返回RST。如果想拒絕對不存在的連接進行SYN,可以使用這種辦法。如果到達的信息有一個ACK域,返回的RST信息可以從ACK域中取得序列號,如果沒有這個域,就把RST的序列號設置為0,ACK域被設備為序列號和到達段長度之和。連接仍然處于CLOSE狀態。如果連接處于非同步狀態(LISTEN,SYN-SENT,SYN-RECEIVED),而且收到的確認是對未發出包的確認或是接收到數據段的安全級別與不能連接要求的相一一致時,就發送RST。如果SYN未被確認時,而且收到的數據段的優先級比要求的優先級要高,那么要么提高本地優先級(得事先征得用戶和系統的許可)要么發送RST;如果接收數據段的優先級比要求的優先級低,就算是匹配了,當然如果對方發現優先級不對提高了優先級,在下一個包中提高了優先級,這就不算是匹配了。如果連接已經進入SYN,那么接收到數據段的優先級必須和本地優先級一樣,否則發送RST。如果到達的信息有一個ACK域,返回的RST信息可以從ACK域中取得序列號,如果沒有這個域,就把RST的序列號設置為0,ACK域被設備為序列號和到達段長度之和。連接仍然處于與原來相同的狀態。如果連接處于同步狀態(ESTABLISHED,FIN-WAIT-1,FIN-WAIT-2,CLOSE-WAIT,CLOSING,LAST-ACK,TIME-WAIT),任何超出接收窗口的序列號的數據段都產生如下結果:發出一個空確認數據段,此段中包括當前發送序列號,另外還包括一個確認指出希望接收的下一個數據段的序列號,連接仍然保存在原來的狀態。如果因為安全級,優先級之類的問題,那就發送RST信號然后進入CLOSED狀態。。