base64原理与实现

待我称王封你为后i 2023-06-30 09:00 94阅读 0赞

1.base64

  bse64是一种以64个可见字符集对二进制数据进行编码的编码算法。

1.1应用范围

  base64常用于网络数据传输过程的编解码环节。HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了base64来将一个较长的一个标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码不仅比较简短,同时也具有不可读性,即所编码的数据不会被人用肉眼所直接看到 [引用百度百科] 。
【1】电子邮件加密;
【2】数据加密;
【3】采用base64来规避反垃圾邮件工具,因为那些工具通常都不会翻译base64的讯息;
【4】图片、文件网络传输。

1.2编码表

  bse64编码表是64个可见字符集。

1.3编码过程

  base64编码,每3个8位明文数据为一组,取这3个字数据的ASCII码,然后以6位为一组组成4个新的数据。对于不足3字节的处理:
【1】不足三字节后面填充0;
【2】对于编码前的数据产生的6位,如果为0,则索引到的字符为‘A’;因不足3字节而填充的0,用’=’来替代,有点结束符的意思。

例如对“ABCD”进行base64编码:

对于不足6位的补零(图中浅红色的4位),索引为“A”;对于最后不足3字节,进行补零处理(图中红色部分),以“=”替代,因此,“ABCD”的base64编码为:“QUJDRA==”。

1.4解码过程

  base64解码,即是base64编码的逆过程,如果理解了编过过程,解码过程也就容易理解。将base64编码数据根据编码表分别索引到编码值,然后每4个编码值一组组成一个24位的数据流,解码为3个字符。对于末尾位“=”的base64数据,最终取得的4字节数据,需要去掉“=”再进行转换。

解码过程可以参考上图,逆向理解:“QUJDRA==” ——>“ABCD”

2.实现

  base64应用范围很广,因此很多编程语言的标准库都提供base64编解码库,如PHP、Python等,一般不需重复造轮子,但能够重复造一遍轮子,会理解更透彻。

(1) C语言版

  1. #include <stdint.h>
  2. #include <stdbool.h>
  3. #include <stdlib.h>
  4. #include <string.h>
  5. #include <stdio.h>
  6. const char *base64_table="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; /* base64编码表 */
  7. static int num_strchr(const char *str, char c)
  8. {
  9. const char *p = strchr(str, c);
  10. if (NULL == p)
  11. {
  12. return -1;
  13. }
  14. return p - str;
  15. }
  16. uint32_t base64_get_dest_len(uint32_t src_len)
  17. {
  18. return 4 * ((src_len+2)/3);
  19. }
  20. uint32_t src_get_dest_len(uint32_t base64_len)
  21. {
  22. return base64_len/4*3 - 2;
  23. }
  24. int base64_encode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
  25. {
  26. uint32_t i,j,len;
  27. len = base64_get_dest_len(src_len);
  28. if(dest_len < len)
  29. {/* 空间不足 */
  30. return -1;
  31. }
  32. for(i=0; i<src_len/3; i++)
  33. {
  34. *dest_str++ =base64_table[(src_str[0]>>2) & 0x3f]; /* 取第一字符前6bit */
  35. *dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)]; /* 第一字符的后2bit与第二字符的前4位进行合并 */
  36. *dest_str++ =base64_table[((src_str[1]<<2) & 0x3c) | ((src_str[2]>>6) & 0x03)]; /* 将第二字符的后4bit与第三字符的前2bit组合并 */
  37. *dest_str++ =base64_table[src_str[2] & 0x3f]; /* 取第三字符的后6bit */
  38. src_str += 3;
  39. }
  40. /* 非3的整数倍补“=” */
  41. if((src_len%3) == 1)
  42. {
  43. *dest_str++ =base64_table[(src_str[0]>>2) & 0x3f];
  44. *dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)];
  45. *dest_str++ ='=';
  46. *dest_str++ ='=';
  47. }
  48. else if((src_len%3) == 2)
  49. {
  50. *dest_str++ =base64_table[(src_str[0]>>2) & 0x3f];
  51. *dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)];
  52. *dest_str++ =base64_table[(src_str[j+1]<<2) & 0x3c];
  53. *dest_str++ ='=';
  54. }
  55. *dest_str = '\0';
  56. return 0;
  57. }
  58. int base64_decode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
  59. {
  60. uint32_t i = 0;
  61. char buf[4] = {0};
  62. if (dest_len < src_get_dest_len(src_len))
  63. {
  64. return -1;
  65. }
  66. for (; (src_str[i]!='\0') && (i<src_len); i+=4)
  67. {
  68. /* 四个码译成三个字符 */
  69. buf[0] = num_strchr(base64_table, src_str[i]);
  70. buf[1] = num_strchr(base64_table, src_str[i+1]);
  71. *dest_str++ = ((buf[0] << 2) & 0xfc) | ((buf[1]>>4) & 0x03);
  72. if (src_str[i+2] == '=')
  73. {
  74. break;
  75. }
  76. buf[2] = num_strchr(base64_table, src_str[i + 2]);
  77. *dest_str++ = ((buf[1] << 4) & 0xf0) | ((buf[2] >> 2) & 0x0f);
  78. if (src_str[i + 3] == '=')
  79. {
  80. break;
  81. }
  82. buf[3] = num_strchr(base64_table, src_str[i + 3]);
  83. *dest_str++ = ((buf[2] << 6) & 0xc0) | (buf[3] & 0x3f);
  84. }
  85. *dest_str = '\0';
  86. return 0;
  87. }
  88. int main(int argc,char **argv)
  89. {
  90. char *buf = NULL;
  91. uint32_t dest_len,src_len;
  92. if(argc < 3)
  93. return -1;
  94. if(strcmp(argv[1],"decode") == 0)
  95. {
  96. src_len = strlen(argv[2]);
  97. dest_len = src_get_dest_len(src_len);
  98. buf = (char*)malloc(dest_len);
  99. if(buf == NULL)
  100. return -1;
  101. base64_decode(argv[2], src_len, buf, dest_len);
  102. printf("base64 str:%s\n",argv[2]);
  103. printf("base64_decode str:%s\n",buf);
  104. }
  105. else if(strcmp(argv[1],"encode") == 0)
  106. {
  107. src_len = strlen(argv[2]);
  108. dest_len = base64_get_dest_len(src_len);
  109. buf = (char*)malloc(dest_len);
  110. if(buf == NULL)
  111. return -1;
  112. base64_encode(argv[2], src_len, buf, dest_len);
  113. printf("src str:%s\n",argv[2]);
  114. printf("base64_encode str:%s\n",buf);
  115. }
  116. free(buf);
  117. buf = NULL;
  118. return 0;
  119. }

编译测试:
在这里插入图片描述

base64加密/解密在线工具 http://tool.chinaz.com/Tools/Base64.aspx

发表评论

表情:
评论列表 (有 0 条评论,94人围观)

还没有评论,来说两句吧...

相关阅读

    相关 Base64编码原理

    遇到的问题:将昵称设置为表情符入库时出错,原因:数据库编码格式为utf-8. 解决方案: 1、将数据库编码格式改为utf8mb4;(该方法不太好,需要修改数据库编码格式)

    相关 Base64的编码原理

    这里可能需要借助一些在线工具,例如系统编码的AsciI码对照表,例如我的就是gb2312的,具体查看自己系统编码可以cmd下输入chcp得到一组数字后去编码对照表查找,还有就是