一、网络编程三要素

1、IP地址和域名

(1)IP地址

  • IP地址:指互联网协议地址(Internet Protocol Address),俗称IP。IP地址用来给一个网络中的计算机设备做唯一的编号,唯一标识网络中的设备

  • IP地址分类

    • 方式一:
      • IPv4:是一个32位的二进制数,通常被分为4个字节,表示成a.b.c.d 的形式(例192.168.65.100),其中a、b、c、d都是0~255之间的十进制整数,最多可以表示42亿个
      • IPv6:采用128位地址长度,每16个字节一组,分成8组十六进制数,表示成ABCD:EF01:2345:6789:ABCD:EF01:2345:6789

IPv4和IPv6地址格式不相同,因此在很长一段时间里,互联网中出现IPv4和IPv6长期共存的局面

    • 方式二:
      • 公网地址(万维网使用)
      • 私有地址(局域网使用):范围为192.168.0.0–192.168.255.255,专门为组织机构内部使用
  • 特殊的IP地址:

    • 本地回环地址(hostAddress):127.0.0.1
    • 主机名(hostName):localhost

(2)域名

  • 因为IP地址数字不便于记忆,因此出现了域名,域名容易记忆
  • 域名解析:当在连接网络时输入一个主机的域名后,域名服务器(DNS)负责将域名转化成IP地址,这样才能和主机建立连接
    1. 在浏览器中输入一个域名,操作系统会先检查自己本地的hosts文件是否有这个网址映射关系,如果有,就先调用这个IP地址映射,完成域名解析
    2. 如果hosts里没有这个域名的映射,则查找本地DNS解析器缓存,是否有这个网址映射关系,如果有,直接返回,完成域名解析
    3. 如果hosts与本地DNS解析器缓存都没有相应的网址映射关系,首先会找TCP/IP参数中设置的首选DNS服务器,在此我们叫它本地DNS服务器,此服务器收到查询时,如果要查询的域名,包含在本地配置区域资源中,则返回解析结果给客户机,完成域名解析,此解析具有权威性
    4. 如果要查询的域名,不由本地DNS服务器区域解析,但该服务器已缓存了此网址映射关系,则调用这个IP地址映射,完成域名解析,此解析不具有权威性
    5. 如果本地DNS服务器本地区域文件与缓存解析都失效,则根据本地DNS服务器的设置进行查询
      1. 如果未用转发模式,本地DNS就把请求发至13台根DNS,根DNS服务器收到请求后会判断这个域名(.com)是谁来授权管理,并会返回一个负责该顶级域名服务器的一个IP。本地DNS服务器收到IP信息后,将会联系负责.com域的这台服务器。这台负责.com域的服务器收到请求后,如果自己无法解析,它就会找一个管理.com域的下一级DNS服务器地址给本地DNS服务器。当本地DNS服务器收到这个地址后,就会找域服务器,重复上面的动作,进行查询,直至找到主机
      2. 如果用的是转发模式,此DNS服务器就会把请求转发至上一级DNS服务器,由上一级服务器进行解析,上一级服务器如果不能解析,或找根DNS或把转请求转至上上级,以此循环。不管是本地DNS服务器用是是转发,还是根提示,最后都是把结果返回给本地DNS服务器,由此DNS服务器再返回给客户机

img

2、端口号

  • 端口号:唯一标识设备中的进程,用两个字节表示的整数,它的取值范围是0~65535

    • 公认端口:0~1023。被预先定义的服务通信占用,如:HTTP(80),FTP(21),Telnet(23)
    • 注册端口:1024~49151。分配给用户进程或应用程序,如:Tomcat(8080),MySQL(3306),Oracle(1521)
    • 动态/私有端口:49152~65535
  • 如果端口号被另外一个服务或应用所占用,会导致当前程序启动失败

3、网络通信协议

  • 网络通信协议:通过计算机网络可以使多台计算机实现连接,在计算机网络中,这些连接和通信的规则被称为网络通信协议,它对数据的传输格式、传输速率、传输步骤等做了统一规定,通信双方必须同时遵守才能完成数据交换

    • OSI参考模型:模型过于理想化,未能在因特网上进行广泛推广。 TCP/IP参考模型(或TCP/IP协议):事实上的国际标准
    • TCP/IP协议: 传输控制协议/因特网互联协议( Transmission Control Protocol/Internet Protocol),是Internet最基本、最广泛的协议。它定义了计算机如何连入因特网,以及数据如何在它们之间传输的标准。它的内部包含一系列的用于处理数据通信的协议,并采用了4层的分层模型,每一层都呼叫它的下一层所提供的协议来完成自己的需求,TCP/IP协议中的四层分别是应用层、传输层、网络层和链路层,每层分别负责不同的通信功能
      • 链路层:用于定义物理传输通道,通常是对某些网络连接设备的驱动协议,例如针对光纤、网线提供的驱动
      • 网络层:整个TCP/IP协议的核心,它主要用于将传输的数据进行分组,将分组数据发送到目标计算机或者网络。而IP协议是一种非常重要的协议。IP(internet protocal)又称为互联网协议。IP的责任就是把数据从源传送到目的地,它在源地址和目的地址之间传送数据包,还提供对数据大小的重新组装功能,以适应不同网络对包大小的要求
      • 传输层:主要使网络程序进行通信,在进行网络通信时,可以采用TCP协议,也可以采用UDP协议
      • 应用层:主要负责应用程序的协议,例如HTTP协议、FTP协议、SNMP(简单网络管理协议)、SMTP(简单邮件传输协议)和POP3(Post Office Protocol 3的简称,即邮局协议的第3个版)
  • 通常我们说的TCP/IP协议,是指TCP/IP协议族,因为该协议家族的两个最核心协议:TCP(传输控制协议)和IP(网际协议)为该家族中最早通过的标准,所以简称为TCP/IP协议

img

二、TCP与UDP协议

  • java.net 包中提供了两种常见的网络协议的支持:

    • UDP:用户数据报协议(User Datagram Protocol)
    • TCP:传输控制协议 (Transmission Control Protocol)

1、UDP协议

  • UDP:用户数据报协议(User Datagram Protocol),它是非面向连的,不可靠的无连接通信协议,即在数据传输时,数据的发送端和接收端不建立逻辑连接

  • 由于使用UDP协议消耗资源小,通信效率高,所以通常都会用于音频、视频和普通数据的传输例如视频会议都使用UDP协议,因为这种情况即使偶尔丢失一两个数据包,也不会对接收结果产生太大影响

  • 但是在使用UDP协议传送数据时,由于UDP的面向无连接性,不能保证数据的完整性,因此在传输重要数据时不建议使用UDP协议

  • 大小限制:数据被限制在64kb以内,超出这个范围就不能发送了

  • 数据报(Datagram):网络传输的基本单位

2、TCP协议

  • TCP:传输控制协议 (Transmission Control Protocol)。它是面向连接的,可靠的通信协议,即传输数据之前,在发送端和接收端建立逻辑连接,然后再传输数据,它提供了两台计算机之间可靠无差错的数据传输。是一种面向连接的、可靠的、基于字节流的传输层的通信协议,可以连续传输大量的数据

  • TCP协议负责收集数据信息包,并将其按适当的次序放好传送,在接收端收到后再将其正确的还原,保证了数据包在传送中准确无误

  • TCP协议使用重发机制,当一个通信实体发送一个消息给另一个通信实体后,需要收到另一个通信实体确认信息,如果没有收到另一个通信实体确认信息,则会再次重复刚才发送的消息

  • 三次握手:当一台计算机需要与另一台远程计算机连接时,TCP协议会采用“三次握手”方式让它们建立一个连接,用于发送和接收数据的虚拟链路,以保证连接的可靠性

    • 第一次握手,客户端向服务器端发出连接请求,等待服务器确认
    • 第二次握手,服务器端向客户端回送一个响应,通知客户端收到了连接请求
    • 第三次握手,客户端再次向服务器端发送确认信息,确认连接

img

  • 四次挥手:数据传输完毕TCP协议会采用“四次挥手”方式断开连接

    • 第一次挥手:客户端向服务器端提出结束连接,让服务器做最后的准备工作。此时,客户端处于半关闭状态,即表示不再向服务器发送数据了,但是还可以接受数据
    • 第二次挥手:服务器接收到客户端释放连接的请求后,会将最后的数据发给客户端。并告知上层的应用进程不再接收数据
    • 第三次挥手:服务器发送完数据后,会给客户端发送一个释放连接的报文。那么客户端接收后就知道可以正式释放连接了
    • 第四次挥手:客户端接收到服务器最后的释放连接报文后,要回复一个彻底断开的报文。这样服务器收到后才会彻底释放连接。这里客户端,发送完最后的报文后,会等待2MSL,因为有可能服务器没有收到最后的报文,那么服务器迟迟没收到,就会再次给客户端发送释放连接的报文,此时客户端在等待时间范围内接收到,会重新发送最后的报文,并重新计时。如果等待2MSL后,没有收到,那么彻底断开

img

3、网络编程API

(1)Socket分类

  • 通信的两端都要有Socket(套接字),是两台机器间通信的端点。网络通信其实就是Socket间的通信

  • Socket可以分为:

    • 流套接字(stream socket):使用TCP提供可依赖的字节流服务
      • ServerSocket:此类实现TCP服务器套接字,服务器套接字等待请求通过网络传入
      • Socket:此类实现客户端套接字
    • 数据报套接字(datagram socket):使用UDP提供“尽力而为”的数据报服务
      • DatagramSocket:此类表示用来发送和接收UDP数据报包的套接字

(2)Socket相关类API

  • ServerSocket类

    • ServerSocket类的构造方法:ServerSocket(int port) ,创建绑定到特定端口的服务器套接字
    • ServerSocket类的常用方法:Socket accept(),侦听并接受到此套接字的连接
  • Sokcet类

    • Socket类的常用构造方法:
      • public Socket(InetAddress address,int port):创建一个流套接字并将其连接到指定 IP 地址的指定端口号
      • public Socket(String host,int port):创建一个流套接字并将其连接到指定主机上的指定端口号
    • Socket类的常用方法:
      • public InputStream getInputStream():返回此套接字的输入流,可以用于接收消息
      • public OutputStream getOutputStream():返回此套接字的输出流,可以用于发送消息
      • public InetAddress getInetAddress():此套接字连接到的远程 IP 地址;如果套接字是未连接的,则返回 null
      • public InetAddress getLocalAddress():获取套接字绑定的本地地址
      • public int getPort():此套接字连接到的远程端口号。如果尚未连接套接字,则返回 0
      • public int getLocalPort():返回此套接字绑定到的本地端口。如果尚未绑定套接字,则返回 -1
      • public void close():关闭此套接字。套接字被关闭后,便不可在以后的网络连接中使用(即无法重新连接或重新绑定),需要创建新的套接字对象(关闭此套接字也将会关闭该套接字的输入输出流)
      • public void shutdownInput():禁用此套接字的输入流。此时从套接字输入流读取内容,流将返回 EOF(文件结束符), 即不能在从此套接字的输入流中接收任何数据
      • public void shutdownOutput():禁用此套接字的输出流。对于TCP套接字,任何以前写入的数据都将被发送,并且后跟TCP的正常连接终止序列。此时写入套接字输出流,则该流将抛出 IOException。 即不能通过此套接字的输出流发送任何数据

(3)DatagramSocket相关类API

  • DatagramSocket类的常用构造方法

    • public DatagramSocket(int port):创建数据报套接字并将其绑定到本地主机上的指定端口。套接字将被绑定到通配符地址,IP 地址由内核来选择
    • public DatagramSocket(int port,InetAddress laddr):创建数据报套接字,将其绑定到指定的本地地址。本地端口必须在 0 到 65535 之间(包括两者)。如果 IP 地址为 0.0.0.0,套接字将被绑定到通配符地址,IP 地址由内核选择
  • DatagramSocket类的常用方法

    • public void close():关闭此数据报套接字
    • public void send(DatagramPacket p):从此套接字发送数据报包。DatagramPacket 包含的信息指示:将要发送的数据、其长度、远程主机的IP地址和远程主机的端口号
    • public void receive(DatagramPacket p):从此套接字接收数据报包。当此方法返回时,DatagramPacket 的缓冲区填充了接收的数据。数据报包也包含发送方的 IP 地址和发送方机器上的端口号。 此方法在接收到数据报前一直阻塞。数据报包对象的 length 字段包含所接收信息的长度。如果信息比包的长度长,该信息将被截短

(4)DatagramPacket相关类API

  • DatagramPacket类的常用构造方法

    • public DatagramPacket(byte[] buf,int length):构造 DatagramPacket,用来接收长度为 length 的数据包。 length 参数必须小于等于 buf.length
    • public DatagramPacket(byte[] buf,int length,InetAddress address,int port):构造数据报包,用来将长度为 length 的包发送到指定主机上的指定端口号。length参数必须小于等于buf.length
  • DatagramPacket类的常用方法

    • public int getLength():返回将要发送或接收到的数据的长度

4、TCP网络编程

(1)通信模型

  • Java语言基于套接字TCP编程分为服务端编程和客户端编程,其通信模型如图所示:

img

(2)开发步骤

  • 服务器端程序包含以下四个基本步骤:

    • 调用ServerSocket(int port) :创建一个服务器端套接字,并绑定到指定端口上
    • 调用accept() :监听连接请求,如果客户端请求连接,则接受连接,返回通信套接字对象
    • 调用该Socket类对象的getOutputStream()和getInputStream():获取输出流和输入流,开始网络数据的发送和接收
    • 关闭Socket 对象:客户端访问结束,关闭通信套接字
  • 客户端程序包含以下四个基本步骤 :

    • 创建 Socket :根据指定服务端的 IP 地址或端口号构造 Socket 类对象。若服务器端响应,则建立客户端到服务器的通信线路。若连接失败,会出现异常
    • 打开连接到Socket的输入/出流:使用 getInputStream()方法获得输入流,使用getOutputStream()方法获得输出流,进行数据传输
    • 按照一定的协议对Socket进行读/写操作:通过输入流读取服务器放入线路的信息(但不能读取自己放入线路的信息),通过输出流将信息写入线路
    • 关闭Socket :断开客户端到服务器的连接,释放线路

5、UDP网络编程

UDP(User Datagram Protocol,用户数据报协议):是一个无连接的传输层协议、提供面向事务的简单不可靠的信息传送服务,类似于短信

(1)通信模型

  • 面向非连接:UDP协议是一种面向非连接的协议,面向非连接指的是在正式通信前不必与对方先建立连接,不管对方状态就直接发送,至于对方是否可以接收到这些数据内容,UDP协议无法控制,因此说,UDP协议是一种不可靠的协议。无连接的好处就是快,省内存空间和流量,因为维护连接需要创建大量的数据结构。UDP会尽最大努力交付数据,但不保证可靠交付,没有TCP的确认机制、重传机制,如果因为网络原因没有传送到对端,UDP也不会给应用层返回错误信息
  • 面向数据报文:UDP协议是面向数据报文的信息传送服务。UDP在发送端没有缓冲区,对于应用层交付下来的报文在添加了首部之后就直接交付于ip层,不会进行合并,也不会进行拆分,而是一次交付一个完整的报文
  • 没有拥塞控制:UDP协议没有拥塞控制,所以当网络出现的拥塞不会导致主机发送数据的速率降低。虽然UDP的接收端有缓冲区,但是这个缓冲区只负责接收,并不会保证UDP报文的到达顺序是否和发送的顺序一致。因为网络传输的时候,由于网络拥塞的存在是很大的可能导致先发的报文比后发的报文晚到达。如果此时缓冲区满了,后面到达的报文将直接被丢弃。这个对实时应用来说很重要,比如:视频通话、直播等应用
  • 因此UDP适用于一次只传送少量数据、对可靠性要求不高的应用环境,数据报大小限制在64K以下

img

(2)开发步骤

  • 发送端程序包含以下四个基本步骤:

    • 创建DatagramSocket :
      • 使用系统随机分配的端口号
      • 将要发送的数据用字节数组表示,并指定要发送的数据长度,接收方的IP地址和端口号
    • 调用该DatagramSocket类对象的send方法:发送数据报DatagramPacket对象
    • 关闭DatagramSocket 对象:发送端程序结束,关闭通信套接字
  • 接收端程序包含以下四个基本步骤 :

    • 创建DatagramSocket :
      • 指定监听的端口号
      • 指定接收数据用的字节数组,起到临时数据缓冲区的效果,并指定最大可以接收的数据长度
    • 调用该DatagramSocket类对象的receive方法:接收数据报DatagramPacket对象
    • 关闭DatagramSocket:接收端程序结束,关闭通信套接字