一、背景
最近在项目中涉及到中英文翻译的功能需求,合情合理,所以肯定是要能支持到的!
二、技术选型
2.1、实现设想
自己写一个翻译软件肯定不太可行的(我也整不出来啊),肯定是找寻一个现有的解决方案哈。
2.2、目前市面上的翻译
目前来说,比较为人所熟知的翻译主要有:百度翻译、谷歌翻译、有道翻译、金山翻译...并且他们也都有对应的api支持的。
① 这里附上其相关的官方地址信息:https://fanyi.baidu.com/home、https://translate.google.cn/、https://ai.youdao.com/?keyfrom=old-openapi#/
② 其中百度翻译相关产品信息如下:
③ 有道翻译的产品相关信息如下:
2.3、最终选型
综合考虑,我这边选择百度翻译,只要看上标准版的免费哈!
PS: 像阿里云翻译啊这些其实和有道翻译是差不多的,是以资源包的形式来进行业务支持的。
三、接入流程
3.1、注册百度翻译平台
① 在接入百度翻译时需要有账号支持,像普通的账号注册一样,我们按照其操作说明注册账号即可。
② 选择服务,我这边选择的是通用翻译的标准版
③ 配置api服务信息,主要是配置服务器IP(在配置之外的IP上时无法使用接入api的)
④ 整体操作后,控制台如下:
3.2、接入须知
这里借用官方的一些文字说明(更为详尽的信息请进入官方平台查阅:https://fanyi-api.baidu.com/doc/21)通用翻译API通过HTTP接口对外提供多语种互译服务。您只需要通过调用通用翻译API,传入待翻译的内容,并指定要翻译的源语言(支持源语言语种自动检测)和目标语言种类,就可以得到相应的翻译结果。
通用翻译API HTTP地址:
http://api.fanyi.baidu.com/api/trans/vip/translate
通用翻译API HTTPS地址:
https://fanyi-api.baidu.com/api/trans/vip/translate
请求方式: 可使用GET或POST方式,如使用POST方式,Content-Type请指定为:application/x-www-form-urlencoded
字符编码:统一采用UTF-8编码格式
query长度:为保证翻译质量,请将单次请求长度控制在 6000 bytes以内。(汉字约为2000个)
3.3、核心代码部分
① 翻译工具类
public class TransUtil { @Value("${baiduTranslate.appid}") private String appid; @Value("${baiduTranslate.securityKey}") private String securityKey; private static final String TRANS_API_HOST = "http://api.fanyi.baidu.com/api/trans/vip/translate"; public String getTransResult(String query, String from, String to) { Map<String, String> params = buildParams(query, from, to); return HttpClientUtil.doGet(TRANS_API_HOST, params); } private Map<String, String> buildParams(String query, String from, String to) { Map<String, String> params = new HashMap<String, String>(); params.put("q", query); params.put("from", from); params.put("to", to); params.put("appid", appid); /* 随机数 */ String salt = String.valueOf(System.currentTimeMillis()); params.put("salt", salt); /* 签名,加密前的原文 */ String src = appid + query + salt + securityKey; params.put("sign", MD5.md5(src)); return params; }}
Java
② MD5工具类
public class MD5 { /* 首先初始化一个字符数组,用来存放每个16进制字符 */ private static final char[] hexDigits = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' }; /** * 获得一个字符串的MD5值 * * @param input 输入的字符串 * @return 输入字符串的MD5值 * */ public static String md5(String input) { if (input == null){ return null; } try { /* 拿到一个MD5转换器(如果想要SHA1参数换成”SHA1”) */ MessageDigest messageDigest = MessageDigest.getInstance("MD5"); /* 输入的字符串转换成字节数组 */ byte[] inputByteArray = new byte[0]; try { inputByteArray = input.getBytes("utf-8"); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } /* inputByteArray是输入字符串转换得到的字节数组 */ messageDigest.update(inputByteArray); /* 转换并返回结果,也是字节数组,包含16个元素 */ byte[] resultByteArray = messageDigest.digest(); /* 字符数组转换成字符串返回 */ return byteArrayToHex(resultByteArray); } catch (NoSuchAlgorithmException e) { return null; } } /** * 获取文件的MD5值 * * @param file * @return */ public static String md5(File file) { try { if (!file.isFile()) { System.err.println("文件" + file.getAbsolutePath() + "不存在或者不是文件"); return null; } FileInputStream in = new FileInputStream(file); String result = md5(in); in.close(); return result; } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return null; } public static String md5(InputStream in) { try { MessageDigest messagedigest = MessageDigest.getInstance("MD5"); byte[] buffer = new byte[1024]; int read = 0; while ((read = in.read(buffer)) != -1) { messagedigest.update(buffer, 0, read); } in.close(); String result = byteArrayToHex(messagedigest.digest()); return result; } catch (NoSuchAlgorithmException e) { e.printStackTrace(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return null; } private static String byteArrayToHex(byte[] byteArray) { /* new一个字符数组,这个就是用来组成结果字符串的(解释一下:一个byte是八位二进制,也就是2位十六进制字符(2的8次方等于16的2次方))*/ char[] resultCharArray = new char[byteArray.length * 2]; /* 遍历字节数组,通过位运算(位运算效率高),转换成字符放到字符数组中去 */ int index = 0; for (byte b : byteArray) { resultCharArray[index++] = hexDigits[b >>> 4 & 0xf]; resultCharArray[index++] = hexDigits[b & 0xf]; } /* 字符数组组合成字符串返回 */ return new String(resultCharArray); }}
Java
3.4、测试结果
四、后记
其实搜索免费翻译平台api可以查出很多信息,也有平台支持到免费试用。我试了谷歌翻译和有道翻译的免费api,发现一个比较致命的问题,就是调用次数过多的时候会被限制(这是正常情况啦)。以谷歌翻译api为例,我在2s间隔的情况下调用六十多次就被限制了,有道翻译的api会好一些在2s间隔连续调用了170多次后还能使用。
我也曾想过多去轮询有道和谷歌翻译但是总归还是有限流的风险的,这对于一个线上项目是很不友好的!那这里有朋友可能会说,你现在的通用翻译标准版的QPS也只是1,一样有可能无法满足业务情况!那么针对这种情况我们其实可以多注册几个账号,然后轮询使用多个api哈,当然如果这时也不能满足了.那只能说你现在的业务量已经不能允许你白嫖了!老实注册一个高级版(每月还有200w的使用字符量的)。