Eureka注册不上或注册后IP不对(多网卡的坑及解决)
作者:楼兰过客
一、问题发现
使用SpringCloud一套的微服务项目在开发测试环境都再正常不过了,到生产部署的时候启动服务就死活无法启动,去看启动日志发现,在获取配置中心配置时连接不到配置中心了,报了一个Host Unreachable
的错。
按道理来说这个错很简单,就是网络不通导致的。
但是问题就出现在这儿,我直接ping注册中心和配置中心的IP是通的,没有问题。
再仔细一看才发现事情并不简单,我们生产环境开放的是一套10.21.xx.xx的网段IP,但是日志中却去寻找29.192.xx.xx去了,打开eureka控制台发现注册到注册中心上的配置中心确实是29.192.xx.xx,并且注册中心显示的自己的IP也是29.192.xx.xx。
配置中心启动没问题是因为他和注册中心在一台机器上,所以用什么样的ip都无关紧要,其他服务想要拉取配置中心所在机器的配置就拉不到了。
问题是我们其他服务在配置eureka client的时候填写的eureka server地址确实都是10.21.xx.xx,为什么注册中心会自动改成29.192.xx.xx。
咨询了客户方之后才知道,29.192.xx.xx这个IP是用来监控服务器用的,各服务器之间都通过这个IP发送心跳来保持在线状态,不能做业务使用。
二、拨云见日
知道这个IP从哪儿来下一步就要分析解决了,先查看网络配置
确实从网卡配置顺序上来说eureka client选取了第一块网卡配置的IP向注册中心注册,这就导致了无法连接的问题。
那么问题就指向了eureka client是如何选取网卡IP进行注册的以及如何能让eureka client根据我们的意愿选择我们想要的IP进行注册。
去官网查找并没有找到关于eureka client是如何选取网卡IP的描述,那么就只能去扒源码了。
最终找到是在com.netflix.appinfo包下的InstanceInfo类封装了本机信息,其中就包括了IP地址的获取方法。
在 Spring Cloud 环境下,Eureka Client并没有自己实现探测本机IP的逻辑,而是交给Spring的InetUtils工具类的findFirstNonLoopbackAddress()方法完成的,下边贴出这个方法的源码:
public InetAddress findFirstNonLoopbackAddress() { InetAddress result = null; try { int lowest = Integer.MAX_VALUE; for (Enumeration<NetworkInterface> nics = NetworkInterface .getNetworkInterfaces(); nics.hasMoreElements();) { NetworkInterface ifc = nics.nextElement(); if (ifc.isUp()) { log.trace("Testing interface: " + ifc.getDisplayName()); if (ifc.getIndex() < lowest || result == null) { lowest = ifc.getIndex(); } else if (result != null) { continue; } // @formatter:off if (!ignoreInterface(ifc.getDisplayName())) { for (Enumeration<InetAddress> addrs = ifc .getInetAddresses(); addrs.hasMoreElements();) { InetAddress address = addrs.nextElement(); if (address instanceof Inet4Address && !address.isLoopbackAddress() && isPreferredAddress(address)) { log.trace("Found non-loopback interface: " + ifc.getDisplayName()); result = address; } } } // @formatter:on } } } catch (IOException ex) { log.error("Cannot get first non-loopback address", ex); } if (result != null) { return result; } try { return InetAddress.getLocalHost(); } catch (UnknownHostException e) { log.warn("Unable to retrieve localhost"); } return null; }
这个方法中通过NetworkInterface接口获取到网卡的列表信息进行循环获取,首先判断是否启用(如果网卡禁用再获取IP自然就没意义),在启用状态下拿到网卡的索引值(目的是为了获取网卡的最小索引值),最后还要判断是否在忽略列表中,如果不在忽略列表才能选用。在这一系列的操作过后如果没能获取到最终结果,那么最后就会调用jdk的getLocalHost()方法来获取IP地址并返回。
总体来说,这个工具类会获取所有网卡,依次进行遍历,取ip地址合理、索引值最小、已经启动且不在忽略列表的网卡的ip地址作为结果。如果仍然没有找到合适的IP, 那么就将InetAddress.getLocalHost()做为最后的fallback方案。
三、开刀治病
有了源码的加持,想要达到我们最终获取指定IP的目的就条条大路通罗马了。
1、忽略指定网卡
在bootstrap.yml中添加忽略属性
spring.cloud.inetutils.gnored-interfaces[0]=ens161 # 忽略ens161, 支持正则表达式
注意,不能在application.yml中添加,玩过SpringCloud的应该都懂。
2、禁用无关网卡
如上面网卡信息图即禁用掉ens161和ens256,最终只保留ens224网卡生效,这样一来获取到启用的网卡也就只有一块了。
查看网卡信息(生产环境最终没敢禁用,以下拿我本地环境测试)
[melonrind@melonrind ~]$ ifconfig
enp0s3: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 10.0.2.15 netmask 255.255.255.0 broadcast 10.0.2.255
inet6 fe80::9ee2:1871:6417:19a9 prefixlen 64 scopeid 0x20<link>
ether 08:00:27:75:08:94 txqueuelen 1000 (Ethernet)
RX packets 44098 bytes 59104330 (56.3 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 21246 bytes 1370966 (1.3 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0enp0s8: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 192.168.56.200 netmask 255.255.255.0 broadcast 192.168.56.255
inet6 fe80::1c58:28df:b483:fb7a prefixlen 64 scopeid 0x20<link>
ether 08:00:27:f3:69:ec txqueuelen 1000 (Ethernet)
RX packets 333237 bytes 148991996 (142.0 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 396257 bytes 138439800 (132.0 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
inet 127.0.0.1 netmask 255.0.0.0
inet6 ::1 prefixlen 128 scopeid 0x10<host>
loop txqueuelen 1000 (Local Loopback)
RX packets 224153 bytes 56176690 (53.5 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 224153 bytes 56176690 (53.5 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
[melonrind@melonrind ~]$ nmcli con sh
NAME UUID TYPE DEVICE
enp0s3 e0a2f8ed-112e-41ed-9f35-89502e325c18 ethernet enp0s3
enp0s8 221018b1-6e99-48fc-8c3d-fe7dee581328 ethernet enp0s8
这里就可以禁用掉enp0s3网卡,保留enp0s8
[root@melonrind ~]# ifdown enp0s3 Device 'enp0s3' successfully disconnected.
启用可以用如下命令
[root@melonrind ~]# ifup enp0s3
3、配置host
当网查遍历逻辑都没有找到合适ip时会走JDK的InetAddress.getLocalHost()。该方法会返回当前主机的hostname, 然后会根据hostname解析出对应的ip。
因此如果确认没有找到合适的IP的情况下,可以配置本机的hostname和/etc/hosts文件,直接将本机的主机名映射到指定IP地址。
4、手工指定实例IP
eureka client在启动时可以对该eureka client的实例进行配置,因此这里也可以自己指定IP地址。
可以添加如下配置:
# 指定此实例的ip eureka.instance.ip-address=${你指定的ip地址} # 注册时使用ip而不是主机名 eureka.instance.prefer-ip-address=true
不过该配置需要添加在eureka client配置之上,形如:
eureka: instance: ip-address: 192.168.56.1 prefer-ip-address: true client: register-with-eureka: true fetch-registry: true service-url: defaultZone: http://192.168.56.1:9130/eureka registry-fetch-interval-seconds: 30 eureka-server-connect-timeout-seconds: 5 eureka-server-read-timeout-seconds: 5 filter-only-up-instances: true eureka-connection-idle-timeout-seconds: 30 eureka-server-total-connections: 200 eureka-server-total-connections-per-host: 50
5、服务启动时指定IP
在不方便修改配置文件时可以选用此方式(我就是用此方式解决),在服务启动时添加参数:
java -jar -Dspring.cloud.inetutils.preferred-networks=192.168.56.1 ...
总结
至此,该问题得到解决,又是惊心动魄的一天。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。