Java基础之代码死循环详解
作者:苏三说技术
一、前言
代码死循环
这个话题,个人觉得还是挺有趣的。因为只要是开发人员,必定会踩过这个坑。如果真的没踩过,只能说明你代码写少了,或者是真正的大神。
尽管很多时候,我们在极力避免这类问题的发生,但很多时候,死循环却悄咪咪的来了,坑你于无形之中。我敢保证,如果你读完这篇文章,一定会对代码死循环有一些新的认识,学到一些非常实用的经验,少走一些弯路。
二、死循环的危害
我们先来一起了解一下,代码死循环到底有哪些危害?
- 程序进入假死状态, 当某个请求导致的死循环,该请求将会在很大的一段时间内,都无法获取接口的返回,程序好像进入假死状态一样。
- cpu使用率飙升,代码出现死循环后,由于没有休眠,一直不断抢占cpu资源,导致cpu长时间处于繁忙状态,必定会使cpu使用率飙升。
- 内存使用率飙升,如果代码出现死循环时,循环体内有大量创建对象的逻辑,垃圾回收器无法及时回收,会导致内存使用率飙升。同时,如果垃圾回收器频繁回收对象,也会造成cpu使用率飙升。
- StackOverflowError,在一些递归调用的场景,如果出现死循环,多次循环后,最终会报StackOverflowError栈溢出,程序直接挂掉。
三、哪些场景会产生死循环?
3.1 一般循环遍历
这里说的一般循环遍历主要是指:
- for语句
- foreach语句
- while语句
这三种循环语句可能是我们平常使用最多的循环语句了,但是如果没有用好,也是最容易出现死循环的问题的地方。让我们一起看看,哪些情况会出现死循环。
3.1.1 条件恒等
很多时候我们使用for语句
循环遍历,不满足指定条件,程序会自动退出循环,比如:
for(int i=0; i<10; i++) { System.out.println(i); }
但是,如果不小心把条件写错了,变成这样的:
for(int i=0; i>=0; i++) { System.out.println(i); }
结果就悲剧了,必定会出现死循环,因为循环中的条件变成恒等
的了。
很多朋友看到这里,心想这种错误我肯定不会犯的。不过我需要特别说明的是,这里举的例子相对来说比较简单,如果i>=0
这里是个非常复杂的计算,还真说不准一定不会出现死循环。
3.1.2 不正确的continue
for语句
在循环遍历数组
和list
时更方便,而while语句
的使用场景却更多。
有时候,在使用while语句
遍历数据时,如果遇到特别的条件,可以使用continue
关键字跳过本次循环,直接执行下次循环。
例如:
int count = 0; while(count < 10) { count++; if(count == 4) { continue; } System.out.println(count); }
当count等于4时,不打印count。
但如果continue
没有被正确使用,可能会出现莫名奇怪的问题:
int count = 0; while(count < 10) { if(count == 4) { continue; } System.out.println(count); count++; }
当count等于4时直接推出本次循环,count没有加1,而直接进入下次循环,下次循环时count依然等4,最后无限循环了。
这种是我们要千万小心的场景,说不定,已经进入了死循环你还不知道呢。
3.1.3 flag线程间不可见
有时候我们的代码需要一直做某件事情,直到某个条件达到,有个状态告诉它,要终止任务了,它就会自动退出。
这时候,很多人都会想到用while(flag)
实现这个功能:
public class FlagTest { private boolean flag = true; public void setFlag(boolean flag) { this.flag = flag; } public void fun() { while (flag) { } System.out.println("done"); } public static void main(String[] args) throws InterruptedException { final FlagTest flagTest = new FlagTest(); new Thread(() -> flagTest.fun()).start(); Thread.sleep(200); flagTest.setFlag(false); } }
这段代码在子线程中执行无限循环,当主线程休眠200毫秒后,将flag变成false,这时子线程就会自动退出了。想法是好的,但是实际上这段代码进入了死循环,不会因为flag变成false而自动退出。
为什么会这样?
线程间flag
是不可见的,这时如果flag
加上了volatile
关键字,变成:
private volatile boolean flag = true;
会强制把共享内存中的值刷新到主内存中,让多个线程间可见,程序可以正常退出。
3.2 Iterator遍历
除了前面介绍过的一般循环遍历
之外,遍历集合的元素,还可以使用Iterator遍历
。当然并非所有集合都能使用Iterator遍历
,只有实现了Iterator
接口的集合,或者该集合的内部类实现了Iterator
接口才可以。
例如:
public class IteratorTest { public static void main(String[] args) { List<String> list = new ArrayList<>(); list.add("123"); list.add("456"); list.add("789"); Iterator<String> iterator = list.iterator(); while(iterator.hasNext()) { System.out.println(iterator.next()); } } }
但如果程序改成这样:
public class IteratorTest { public static void main(String[] args) { List<String> list = new ArrayList<>(); list.add("123"); list.add("456"); list.add("789"); while(list.iterator().hasNext()) { System.out.println(list.iterator().next()); } } }
就会出现死循环。
这是什么呢?
如果看过ArrayList
源码的朋友,会发现它的底层iterator方法是这样的实现的:
public Iterator<E> iterator() { return new Itr(); }
每次都new
了一个新的Itr
对象。而hasNext
方法的底层是通过判断游标和元素个数是否相等实现的:
public boolean hasNext() { return cursor != size; }
每次new
了一个新的Itr
对象的时候cursor
值是默认值0,肯定和元素个数不相等。所以导致while语句中的条件一直都成立,所以才会出现死循环。
我们都需要注意:在while循环中使用list.iterator().hasNext(),是个非常大的坑,千万小心。
3.3 类中使用自己的对象
在某个类中把自己的对象定义成成员变量,不知道你有没有这样做过。
有些可能会很诧异,为什么要这么做。
假如,你需要在一个方法中调用另一个打了@Transactional
注解的方法,这时如果直接方法调用,另外一个方法由于无法走代理事务会失效。比如:
@Service public class ServiceA { public void save(User user) { System.out.println("业务处理"); doSave(user); } @Transactional(rollbackFor=Exception.class) public void doSave(User user) { System.out.println("保存数据"); } }
这种场景事务会失效。
这时可以通过把该类自己定义成一个成员变量,通过该变量调用doSave方法就能有效的避免该问题。
@Service public class ServiceA { @Autowired private ServiceA serviceA; public void save(User user) { System.out.println("业务处理"); serviceA.doSave(user); } @Transactional(rollbackFor=Exception.class) public void doSave(User user) { System.out.println("保存数据"); } }
当然还有其他办法解决这个问题,不过这种方法是最简单的。
问题来了,如果成员变量不是通过@Autowired
注入,而是直接new
出来的,可以吗?
成员变量改成这样之后:
private ServiceA serviceA = new ServiceA();
项目在启动的时候,程序进入无限循环,不断创建ServiceA对象,但一直都无法成功。最后会报java.lang.StackOverflowError
栈溢出,当栈深度超过虚拟机分配给线程的栈大小时就会出现此错误。
为什么会出现这个问题?
因为程序在实例化ServiceA对象时,要先实例化它的成员变量serviceA,但是它的成员变量serviceA,又需要实例化它自己的成员变量serviceA,如此一层层实例化下去,最终也没能实例化。
而@Autowired
注入为什么没有问题?
因为@Autowired
是在ServiceA对象实例化成功之外,在依赖注入阶段,把实例注入到成员变量serviceA的。在spring中使用了三级缓存,通过提前暴露ObjectFactory
对象来解决这个自己依赖自己的循环依赖问题。
对spring循环依赖问题有兴趣的朋友,可以看看我之前写的一篇文章《》。
3.4 无限递归
在日常工作中,我们需要经常使用树形结构展示数据,比如:分类、地区、组织、菜单等功能。
很多时候需要从根节点遍历找到所有叶子节点,也需要从叶子节点,往上一直追溯到根节点。
我们以通过根节点遍历找到所有叶子节点为例。由于每次需要一层层遍历查找,而且调用的方法基本相同。为了简化代码,我们一般都会选择使用递归
来实现这个功能。
这里我们以根据叶子节点找到根节点为例,大致代码如下:
public Category findRoot(Long categoryId) { Category category = categoryMapper.findCategoryById(categoryId); if(null == category) { throw new BusinessException("分类不存在"); } Long parentId = category.getParentId(); if(null == categoryId || 0 == categoryId) { return category; } return findRoot(parentId); }
根据categoryId往上递归查找,如果发现parentId为null或者0的时候,就是根节点了,这时直接返回。
这可能是最普通不过的递归调用了,但是如果有人使坏,或者由于数据库误操作,把根节点的parentId改成了二级分类的categoryId一样,比如都改成:1222。这样递归调用会进入无限循环,最终会报java.lang.StackOverflowError
异常。
为了避免这种惨案的发生,其实是有办法的。
可以定义一个运行递归的最大层级MAX_LEVEL,达到了最大层级则直接退出。以上代码可以做如下调整:
private static final int MAX_LEVEL = 6; public Category findRoot(Long categoryId, int level) { if(level >= MAX_LEVEL) { return null; } Category category = categoryMapper.findCategoryById(categoryId); if(null == category) { throw new BusinessException("分类不存在"); } Long parentId = category.getParentId(); if(null == categoryId || 0 == categoryId) { return category; } return findRoot(parentId, ++level); }
先定义MAX_LEVEL的值,然后第一次调用递归方法的时候level字段的值传1,每递归一次level的值加1,当发现level的值大于等于MAX_LEVEL时,说明出现了异常情况,则直接返回null。
我们在写递归方法的时候,要养成好习惯,最好定义一个最大递归层级MAX_LEVEL,防止由于代码bug,或者数据异常,导致出现无限递归的情况。
3.5 hashmap
我们在写代码时,为了提高效率,使用集合的概率非常大。通常情况下,我们喜欢先把数据收集到集合当中,然后对数据进行批处理,比如批量insert或update,提升数据库操作的性能。
我们使用比较多的集合有:ArrayList、HashSet、HashMap等。我个人非常喜欢使用HashMap,特别是在java8中需要嵌套循环的地方,将其中一层循环的数据(list或者set)转换成HashMap,可以减少一层遍历,提升代码的执行效率。
但是如果HashMap使用不当,可能会出现死循环,怎么回事呢?
3.5.1 jdk1.7的HashMap
jdk1.7的HashMap中采用 数组
+ 链表
的结构存储数据。在多线程环境下,同时往HaspMap中put数据时,会触发resize
方法中的transfer
方法,进行数据重新分配的过程,需要重新组织链表的数据。
由于采用了头插法
,最终会形成key3的next等于key7,而key7的next又等于key3的情况,从而构成了死循环。
3.5.2 jdk1.8的HashMap
有了解决jdk1.7扩容时出现死循环的问题,在jdk1.8中对HashMap进行了优化,将jdk1.7中的头插法
改成了尾插法
,另外采用 数组
+ 链表
+ 红黑树
的结构存储数据。如果链表中元素超过8个时,就将链表转化为红黑树,以减少查询的复杂度,将时间复杂度降低为O(logN)。
在多线程环境下,同时往HaspMap中put数据时,会触发root
方法重新组织树形结构的数据。
在for循环中会出现两个TreeNode节点的Parent引用都是对方,从而构成死循环的情况。
3.5.3 ConcurrentHashMap
由于在多线程环境下,使用无论是jdk1.7,还是jdk1.8的HashMap会有死循环的问题。所以很多人建议,不用在多线程环境下,使用HashMap
,而应该改用ConcurrentHashMap
。
ConcurrentHashMap
是线程安全的,同样采用了 数组
+ 链表
+ 红黑树
的结构存储数据,此外还是使用了 cas
+ 分段锁
,默认是16段锁,保证并发写入时,数据不会产生错误。
在多线程环境下,同时往ConcurrentHashMap
中computeIfAbsent
数据时,如果里面还有一个computeIfAbsent,它们的key对应的hashCode是一样的,这时就会产生死循环。
意不意外,惊不惊喜?
幸好这个bug在jdk1.9中已经被Doug Lea修复了。
3.6 动态代理
我们在实际工作中,即使没有自己动手写过动态代理程序,但也听过或者接触过,因为很多优秀的开发框架,它们的底层必定都会使用动态代理,实现一些附加的功能。通常情况下,我们使用最多的动态代理是:JDK动态代理
和 Cglib
,spring的AOP就是通过这两种动态代理技术实现的。
我们在这里以JDK动态代理为例:
public interface IUser { String add(); }
public class User implements IUser { @Override public String add() { System.out.println("===add==="); return "success"; } }
public class JdkProxy implements InvocationHandler { private Object target; public Object getProxy(Object target) { this.target = target; return Proxy.newProxyInstance(this.getClass().getClassLoader(),target.getClass().getInterfaces(),this); } @Override public Object invoke(Object proxy, Method method, Object[] args) throws Throwable { before(); Object result = method.invoke(target,args); after(); return result; } private void before() { System.out.println("===before==="); } private void after() { System.out.println("===after==="); } }
public class Test { public static void main(String[] args) { User user = new User(); JdkProxy jdkProxy = new JdkProxy(); IUser proxy = (IUser)jdkProxy.getProxy(user); proxy.add(); } }
实现起来主要有三步:
1.实现某个具体业务接口
2.InvocationHandler接口,创建调用关系
3.使用Proxy
创建代理类,指定被代理类的相关信息
这样在调用proxy的add方式时,会自动调用before和after方法,实现了动态代理的效果,是不是很酷?
通常情况下,这种写法是没有问题的,但是如果在invoke
方法中调用了proxy
对象的toString
方法,加了这段代码:
proxy.toString();
程序再次运行,循环很多次之后,就会报java.lang.StackOverflowError
异常。
很多人看到这里可能一脸懵逼,到底发生了什么?
代理对象本身并没有自己的方法,它的所有方法都是基于被代理对象的。通常情况下,如果访问代理对象的方法,会经过拦截器的invoke
方法。但是如果在invoke
方法调了代理对象
的方法,比如:toString
方法,会经过另外一个拦截器的invoke
方法,如此一直反复调用,最终形成死循环。
切记不要在invoke方法中调用代理对象的方法,不然会产生死循环,坑你于无形之中。
3.7 我们自己写的死循环
很多朋友看到这个标题,可能会质疑,我们自己会写死循环?
没错,有些场景我们还真的会写。
3.7.1 定时任务
不知道你有没有手写过定时任务,反正我写过,是非常简单的那种(当然复杂的也写过,在这里就不讨论了)。如果有个需求要求每隔5分钟,从远程下载某个文件最新的版本,覆盖当前文件。
这时候,如果你不想用其他的定时任务框架,可以实现一个简单的定时任务,具体代码如下:
public static void downLoad() { new Thread(() -> { while (true) { try { System.out.println("download file"); Thread.sleep(1000 * 60 * 5); } catch (Exception e) { log.error(e); } } }).start(); }
其实很多JDK
中的定时任务,比如:Timer
类的底层,也是用了while(true)的无限循环(也就是死循环)来实现的。
3.7.2 生产者消费者
不知道你有没有手写过生产者和消费者。假设有个需求需要把用户操作日志写入表中,但此时消费中还没有引入消息中间件,比如:kafka
等。
最常规的做法是在接口中同步把日志写入表中,保存逻辑跟业务逻辑可能在同一个事务中,但为了性能考虑,避免大事务的产生,一般建议不放在同一个事务。
原本挺好的,但是如果接口并发量
上来了,为了优化接口性能,可能会把同步写日志到表中的逻辑,拆分出来,做成异步处理的。
这时候,就可以手动撸一个生产者消费者解决这个问题了。
@Data public class Car { private Integer id; private String name; }
@Slf4j public class Producer implements Runnable { private final ArrayBlockingQueue<Car> queue; public Producer(ArrayBlockingQueue<Car> queue) { this.queue = queue; } @Override public void run() { int i = 1; while (true) { try { Car car = new Car(); car.setId(i); car.setName("汽车" + i); queue.put(car); System.out.println("Producer:" + car + ", queueSize:" + queue.size()); } catch (InterruptedException e) { log.error(e.getMessage(),e); } i++; } } }
@Slf4j public class Consumer implements Runnable { private final ArrayBlockingQueue<Car> queue; public Consumer(ArrayBlockingQueue<Car> queue) { this.queue = queue; } @Override public void run() { while (true) { try { Car car = queue.take(); System.out.println("Consumer:" + car + ",queueSize:" + queue.size()); } catch (InterruptedException e) { log.error(e.getMessage(), e); } } } }
public class ClientTest { public static void main(String[] args) { ArrayBlockingQueue<Car> queue = new ArrayBlockingQueue<Car>(20); new Thread(new Producer(queue)).start(); new Thread(new Producer(queue)).start(); new Thread(new Consumer(queue)).start(); } }
由于ArrayBlockingQueue
阻塞队列内部通过notEmpty
和 notFull
这两个Condition
实现了阻塞和唤醒机制,所以我们无需再做额外控制,用它实现生产者消费者相对来说要容易多了。
四、自己写的死循环要注意什么?
不知道聪明的小伙伴们有没有发现,我们自定义的定时任务
和生产者消费者
例子中,也写了死循环,但跟上面其他的例子都不一样,我们写的死循环没有出现问题,这是为什么?
定时任务
中我们用了sleep
方法做休眠:Thread.sleep(300000);
。
生产者消费者
用了Condition
类的await
和signal
方法实现了阻塞和唤醒机制。
这两种机制说白了,都会主动让出cpu一段时间,让其他的线程有机会使用cpu资源。这样cpu有上下文切换的过程,有一段时间是处于空闲状态的,不会像其他的列子中一直处于繁忙状态。
一直处于繁忙状态才是cpu使用率飙高的真正原因,我们要避免这种情况的产生。
就像我们平时骑共享单车(cpu资源)一样,我们一般骑1-2小时就会归还了,这样其他人就有机会使用这辆共享单车。但如果有个人,骑了一个天还没归还,那么这一天当中自行车一直处于繁忙之中,其他人就没有机会骑这辆自行车了。
到此这篇关于Java基础之代码死循环详解的文章就介绍到这了,更多相关Java代码死循环内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!