Java中如何获取图片文件格式(后缀)
作者:CringKong
Java获取图片文件格式(后缀)
今天做一个爬虫,使用正则匹配到<img>标签以后,直接用InputStream流进行下载到内存,然后再使用FileOutputStream保存到硬盘,但是要获取图片文件格式再进行保存。
一开始使用了正则截取,比如<img src="/book/en/v2/images/basic-branching-1.png" />,就直接用字符串截取.png的内容
String imgSrc = "/book/en/v2/images/basic-branching-1.png";
String formatName = imgSrc.split("\\.")[1];但是后来突然想到如果URL的path里就带有 . 那怎么办(虽然我没见到过)
假设一个图片标签 <img src="/book/en/v2/.hahaha/basic-branching-1.png" />,那这样就不能保证是截取到后缀。
想到PHP和Python都有直接处理图片的库,很方便,Java应该也有这种操作吧。
经过去StackOverflow查找一番,发现确实Java这种操作很麻烦,所以自己实现了一个工具方法。
public static List<String> getImageFormat(InputStream srcInputStream) throws IOException {
List<String> formatNameList = new ArrayList<>();
// 获取ImageInputStream 对象
ImageInputStream imageInputStream = ImageIO.createImageInputStream(srcInputStream);
// 获取ImageReader对象的迭代器
Iterator<ImageReader> iterator = ImageIO.getImageReaders(imageInputStream);
// 如果能获得ImageReader对象则说明流中含有图片文件
while(iterator.hasNext()) {
// ImageReader对象的getFormatName()方法可以获得图片格式
formatNameList.add(iterator.next().getFormatName());
}
return formatNameList;
}这样我们就能从连续的图片文件流中获取多个图片文件,实现获取文件真实格式到的后缀。
Java代码获取图片格式及颜色模型
近期服务器总是在上传下载图片的时候出现CPU飙高的情况,想对上传方法进行下改进,查到了一个方法使用ImageIO.read()读取图片,但是可能存在读取CMYK编码的JPEG图片失真问题,本片文章先用Java代码查看给定图片的格式以及颜色模型。
颜色模型
CMYK(Cyan, Magenta, Yellow, Black - Key Plate)模型,指的是使用(青色,品红、黄、黑)4种印刷使用的油墨颜色,作为保存图片的格式。它主要用在印刷中, 让i印刷色彩更加逼真。
RGB模式,是使用(红、绿、蓝)三基色, 作为保存图片的格式。RGB值通常使用三个指定0到255之间的整数,分别代表红、绿、蓝色的强度。它主要用于网页设计中, 方便屏幕显示。
二者在文件保存格式上是有区别的,我们可以通过JPG文件的保存格式上区分:
(1)CMYK模式:JPEG文件中前8个字节是FF D8 FF E1
(2)RGB模式:JPEG文件中前8个字节是FF D8 FF E0
Java代码查看图片类型,以及将图片转十六进制
package com.flex;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import java.util.Iterator;
import javax.imageio.ImageIO;
import javax.imageio.ImageReader;
import javax.imageio.stream.ImageInputStream;
import org.junit.Test;
public class TestImage {
@Test
public void testImageFormat() {
File img = new File("F:/1518048669186_0ssai3.jpg");
System.out.println(getImageFormat(img));//JPEG
}
@Test
public void testColorFormat() {
getImageHex("F:/1518048669186_0ssai3.jpg");
System.out.println("image.text长度:" + new File("F:/image.txt").length());
}
/*
* 获得图片的格式,例如:JPEG、GIF等
*/
public String getImageFormat(Object obj) {
try {
ImageInputStream iis = ImageIO.createImageInputStream(obj);
Iterator<ImageReader> iterator = ImageIO.getImageReaders(iis);
while (iterator.hasNext()) {
ImageReader reader = (ImageReader) iterator.next();
return reader.getFormatName();
}
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
/*
* 图片转十六进制
*/
public void getImageHex(String path) {
try {
Long start = System.currentTimeMillis();
FileInputStream fis = new FileInputStream(path);
java.io.ByteArrayOutputStream bos = new java.io.ByteArrayOutputStream();
byte[] buff = new byte[1024];
int len = 0;
while ((len = fis.read(buff)) != -1) {
bos.write(buff, 0, len);
}
// 得到图片的字节数组
byte[] result = bos.toByteArray();
// 字节数组转成十六进制
String str = byte2HexStr(result);
// 将十六进制串保存到txt文件中
PrintWriter pw = new PrintWriter(new FileWriter("F:/image.txt"));
pw.println(str);
pw.close();
Long end = System.currentTimeMillis();
System.out.println("图片转十六进制花费时间:" + (end - start));
} catch (IOException e) {
e.printStackTrace();
}
}
/*
* 实现字节数组向十六进制的转换方法
*/
public static String byte2HexStr(byte[] b) {
String hs = "";
String stmp = "";
for (int n = 0; n < b.length; n++) {
stmp = (Integer.toHexString(b[n] & 0XFF));
if (stmp.length() == 1)
hs = hs + "0" + stmp;
else
hs = hs + stmp;
}
return hs.toUpperCase();
}
}结果如图


总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
