C 语言读写中文出现乱码
使用 fopen 打开一个utf-8的txt文件,然后用fscanf读取字符串,输出发现是乱码,显示的是用ANSI编码的对应字符
并且在写入文件时,新产生的文件也是ANSI编码的
一开始怀疑文件编码是fopen函数决定的,所以在打开方式后加上了css=utf-8,但是这样子反而导致文件无法打开了。
后来我怀疑文件编码不是fopen决定的,于是我注释掉了fwrite函数,然后惊讶地发现创建的txt是utf-8编码的
因此我认为,读取UTF8文件却得到ANSI编码的字符串是fscanf fwrite这些函数导致的,那么要如何正确的读取中文呢?
这个问题一直困扰了我很久,我试着把文件输出函数换成fputs。。
结果!!!他输出成功了!!!!!
但是读取之后在文本窗口输出时,还是ANSI编码,
至于这些函数的数据编码方式之类的原理,我一直找了好久也没找到
如果有大佬明白原因的话,希望可以不吝赐教
5.13
目前看到的解决方法有
1.采用w_char 宽字符来存储,然后进行一些转码等操作
2.用二进制方式读写文件,用一个无符号字符unsigned char的长度8位为处理单元,最多有256种组合,对应256类字符(贴吧上看到的)