|
Base64编码是一种很常用的编码,在RSA、AES等加密算法中,密钥对的表示通常使用Base64,UTF-7也是在Base64的基础上变化而来,当然所有仅支持ASCII码传输的网关在传输非ASCII码时,都可以使用Base64编码。
Base64编码的方法非常简单,将3个Byte共24Bit从高到低重新拆分成4部分每部分6Bit,分别为0x0~0x3f,对应字符为A~Z和a~z和0-9和+/,共64个。如果最后剩余1个Byte,则将其编码为2个6Bit的Base64编码(第二个Base64编码仅2Bit,需在其后面添加4Bit的0),再在末尾添加2个=字符;如果最后剩余2个Byte,则将其编码为3个6Bit的Base64编码(第三个Base64编码仅4Bit,需在其后面添加2Bit的0),再在末尾添加1个=字符。
Base64解码的方法与编码相反,将4个Base64编码字符转换为对应的0x0~0x3f,共24Bit,然后重新拆分成3部分,每部分8Bit,即1Byte,若末尾有=字符,则按编码方法中描述的规则反向处理。
网上有很多现成的算法,但似乎没有使用JavaScript实现的,实际上使用JavaScript实现也不是太复杂。去年我就写了这个程序,只是忘记放在这里了,前天给学生讲课(放假前的最后一课,开学就大四了,可编程的能力尚需锤炼),讲到了这个,特意加了很多注释,放在这里,以飨读者。
一共写了两个版本,其编码、解码的时间复杂度均为O(n),但版本二使用了一些技巧,使得其效率更高,编码效率约是版本一的3倍,解码效率约是版本一的4倍,同时编码、解码循环内少了一个判断。
版本一: 版本二:
- < html xmlns = "http://www.w3.org/1999/xhtml" >
- < head >
- < meta http-equiv = "Content-Type" content = "text/html; charset=utf-8" />
- < title > Base64编码、解码算法(版本2) - 梦辽软件工作室 </ title >
- < style type = "text/css" >
- body,table {
- font-family:宋体;
- font-size:9pt;
- }
- input {
- width:200px;
- height:25px;
- }
- </ style >
- </ head >
- < body >
- < script type = "text/javascript" >
- /*
- Base64编码规则:
- 1、将三个byte的数据,先后放入一个24bit的缓冲区中,先来的byte占高位;
- 2、数据不足3byte的话,缓冲区中剩下的bit用0补足;
- 3、然后,每次取出6个bit(因为2^ 6 = 64 ,即0到63),按照其值选择ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出;
- 4、不断进行,直到全部输入数据转换完成;
- 5、如果最后剩下两个输入数据,在编码结果后加1个=;如果最后剩下一个输入数据,编码结果后加2个=;如果没有剩下任何数据,则什么都不加,这样可以保证数据还原的正确性。
- 注1:先对输入字符串进行单字节编码,否则,因为charCodeAt()对汉字等符号返回Unicode编码,其长度为16bit;因此,可将所有字符当做双字节处理,虽然增加了字节数量,但简化了双字节字符和单字节字符的识别
- 注2:在JavaScript中,CJK ExtB(扩展字符平面2)中的字符均被当做两个字符,用4Byte编码,即字符"𠀀"~"𪛖",其编码0xD840,0xDC00~0xD869~0xDED6,
- 例:语句:alert("𪛖".charCodeAt(0).toString(16)+" "+"𪛖".charCodeAt(1).toString(16));将显示:d869 ded6
- 技巧:编码时处理源字节,如果字节总数模3余1,则可现在其后面添加2个为0的字节,如果模3余2,则添加1个为0的字节,然后在编码完成后将末尾的2个或1个A字符均替换为=字符;
- 解码时同样可以将末尾的=字符替换为A字符,由于A字符对应0,而0解码为空字符,故可不做任何处理(编码非字符类型的其它字节流,如图片、音视频等,则必须将末尾的0字节去除)。
- */
- function unicodeToByte(str) //将Unicode字符串转换为UCS-16编码的字节数组
- {
- var result =[];
- for(var i = 0 ;i < str.length ;i++)
- result.push(str.charCodeAt(i) > > 8,str.charCodeAt(i)&0xff);
- return result;
- }
- function byteToUnicode(arr) //将UCS-16编码的字节数组转换为Unicode字符串
- {
- var result = "" ;
- for(var i = 0 ;i < arr.length ;i+=2)
- result+=String.fromCharCode((arr[i] < < 8 )+arr[i+1]);
- return result;
- }
- var map = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/" ; //Base64从0到63的对应编码字符集
- function encodeBase64(str)
- {
- var buffer, result = "" , flag = 0 ; //flag表示在字节数组剩余的个数
- var arr = unicodeToByte (str);
- flag = arr .length%3;
- if( flag ==1)
- arr.push(0,0);
- else if( flag ==2)
- arr.push(0);
- for(var i = 0 ;i < arr.length ;i+=3) //此时arr.length一定能被3整除
- {
- buffer =(arr[i] < < 16 )+(arr[i+1] < < 8 )+arr[i+2];
- result+=map.charAt(buffer > > 18)+map.charAt(buffer > > 12&0x3f)+map.charAt(buffer > > 6&0x3f)+map.charAt(buffer&0x3f);
- }
- if( flag ==1)
- result result =result.replace(/AA$/g,"==");
- else if( flag ==2)
- result result =result.replace(/A$/g,"=");
- return result;
- }
- function decodeBase64(str)
- {
- //逆向映射数字索引和Base64编码字符集(简单Hash)
- var s = "var base64={" ;
- for(var i = 0 ;i < 64 ;i++)
- s+="\""+map.charAt(i)+"\":"+i+",";
- s+="\"=\":0};"; //将"="字符对应的编码定义为0,相当于将=字符转换为A字符
- eval(s);
- var buffer, result =[];
- for( i = 0 ;i < str.length ;i+=4) //由于包含Base64末尾包含1个或2个=字符,故str.length一定能被4整除
- {
- buffer =(base64[str.charAt(i)] < < 18 )+(base64[str.charAt(i+1)] < < 12 )+(base64[str.charAt(i+2)] < < 6 )+base64[str.charAt(i+3)];
- result.push(buffer > > 16,buffer > > 8&0xff,buffer&0xff);
- }
- if(/==$/g.test(str)) //如解码为字符串可不做该处理
- {
- result.pop();
- result.pop();
- }
- else if(/=$/g.test(str))
- result.pop();
- return byteToUnicode(result);
- }
- </ script >
- < p > Base64编码、解码算法(版本2) < br /> < br />
- 白宇 - 梦辽软件工作室 - 博讯网络有限责任公司 < br />
- 2011.05.31 </ p >
- < table border = "0" >
- < tr >
- < td > 输入: </ td >
- < td > Base64编码: </ td >
- < td > Base64解码: </ td >
- </ tr >
- < tr >
- < td >
- < textarea wrap = "soft" id = "input" cols = "40" rows = "30" > </ textarea >
- </ td >
- < td >
- < textarea wrap = "soft" id = "encode" cols = "40" rows = "30" > </ textarea >
- </ td >
- < td >
- < textarea wrap = "soft" id = "decode" cols = "40" rows = "30" > </ textarea >
- </ td >
- </ tr >
- < tr >
- < td align = "center" >
- < input type = "button" value = "编码 →" onClick = "encode.value=encodeBase64(input.value)" />
- </ td >
- < td align = "center" >
- < input type = "button" value = "解码 →" onClick = "decode.value=decodeBase64(encode.value);" />
- </ td >
- < td align = "center" >
- < input type = "button" value = "校验 √" onClick = "alert(input.value==decode.value?'校验正确!':'校验错误!');" />
- </ td >
- </ tr >
- </ table >
- </ body >
- </ html >
|
这是完整的HTML文件(单文件),直接保存后就可以运行了。
----------------------------
原文链接:https://blog.51cto.com/mengliao/898745
程序猿的技术大观园:www.javathinker.net
[这个贴子最后由 flybird 在 2020-03-20 11:48:34 重新编辑]
|
|