C++ scanf()函数安全性问题
scanf()是C语言中的一个输入函数。与printf函数一样,都被声明在头文件stdio.h里,因此在使用scanf函数时要加上#include <stdio.h>。(在有一些实现中,printf函数与scanf函数在使用时可以不使用预编译命令#include <stdio.h>。)它是格式输入函数,即按用户指定的格式从键盘上把数据输入到指定的变量之中。
int scanf(const char * restrict format,...);
函数的第一个参数是格式字符串,它指定了输入的格式,并按照格式说明符解析输入对应位置的信息并存储于可变参数列表中对应的指针所指位置。每一个指针要求非空,并且与字符串中的格式符一一顺次对应。
函数 scanf() 是从标准输入流stdin (标准输入设备,一般指向键盘)中读内容的通用子程序,可以说明的格式读入多个字符,并保存在对应地址的变量中。
scanf函数返回成功读入的数据项数,读入数据时遇到了“文件结束”则返回EOF。
scanf()函数安全性问题
(1)在高版本的 Visual Studio 编译器中,scanf 被认为是不安全的,被弃用,应当使用scanf_s代替 scanf。
(2) 对于字符串数组或字符串指针变量,由于数组名可以转换为数组和指针变量名本身就是地址,因此使用scanf()函数时,不需要在它们前面加上"&"操作符。
(3) 可以在格式化字符串中的"%"各格式化规定符之间加入一个整数,表示任何读操作中的最大位数。
(4) scanf函数中没有类似printf的精度控制。
如: scanf("%5.2f",&a); 是非法的。不能企图用此语句输入小数为2位的实数。
(5) scanf中要求给出变量地址,如给出变量名则会出错
如 scanf("%d",a);是非法的,应改为scanf("%d",&a);才是合法的。
(6) 在输入多个数值数据时,若格式控制串中没有非格式字符作输入数据之间的间隔,则可用空格,TAB或回车作间隔。
C编译在碰到空格,TAB,回车或非法数据(如对“%d”输入“12A”时,A即为非法数据)时即认为该数据结束。
(7) 在输入字符数据(%c)时,若格式控制串中无非格式字符,则认为所有输入的字符均为有效字符。
例如:
scanf("%c%c%c",&a,&b,&c);
输入为:
d e f
只有当输入为:def(字符间无空格) 时,才能把'd'赋于a,'e'赋予b,'f'赋予c。 如果在格式控制中加入空格作为间隔,则把'd'赋予a, ' '(空格)赋予b,'e'赋予c。因为%c 只要求读入一个字符,后面不需要用空格作为两个字符的间隔,因此把' '作为下一个字符送给b。
如
scanf("%c %c %c",&a,&b,&c);
我们用一些例子来说明一些规则:则输入时各数据之间可加空格。
#include<stdio.h> int main(void) { char a,b; printf("input character a,b\n"); scanf("%c%c",&a,&b);/*注意两个%c之间没有任何符号*/ printf("%c%c\n",a,b); return 0; }
输入:由于scanf函数"%c%c"中没有空格,输入M N,结果输出只有M。而输入改为MN时则可输出MN两字符,见下面的输入运行情况: input character a,b
1
屏幕显示:
#include <stdio.h> int main(void) { char a,b; printf("input character a,b\n"); scanf("%c %c",&a,&b);/*注意两个%c之间的空格*/ printf("\n%c%c\n",a,b); return 0; }
本例表示scanf格式控制串"%c %c"之间有空格时, 输入的数据之间可以有空格间隔。
(8) 如果格式控制串中有非格式字符则输入时也要输入该非格式字符。
例如:
scanf("%d,%d,%d",&a,&b,&c);
其中用非格式符“ , ”作间隔符,故输入时应为:
5,6,7
又如:
scanf("a=%d,b=%d,c=%d",&a,&b,&c);
则输入应为
a=5,b=6,c=7
如输入的数据与输出的类型不一致时,虽然编译能够通过,但结果将不正确。
#include <stdio.h> int main(void) { int a; printf("input a number"); scanf("%d",&a); printf("%ld",a); return 0; }
如将scanf("%d",&a); 语句改为 scanf("%ld",&a);由于输入数据类型为整型, 而输出语句的格式串中说明为长整型,因此输出结果和输入数据不符。输出并不是输入的值。
输入数据为长整型,输入输出数据才相等。
问题一
如何让scanf()函数正确接受有空格的字符串?如: I love you!
#include <stdio.h>
int main(void)
{
char str[80];
scanf("%s",str);
printf("%s",str);
return 0;
}
输入:
I love you!
输出:
I
上述程序并不能达到预期目的。因为scanf扫描到"I"后面的空格就认为对str的扫描结束(空格没有被扫描),并忽略后面的" love you!"。值得注意的是,我们改动一下上面的程序来验证一下:
#include<stdio.h>
#include<windows.h>
int main(void)
{
char str[80],str1[80],str2[80];
scanf("%s",str);/*此处输入:I love you!*/
printf("%s\n",str);
Sleep(5000);/*这里等待5秒,告诉你程序运行到什么地方*/
/**
*不是sleep(5)
*1,函数名是Sleep不是sleep。
*
2,Windows API中,unsigned Sleep(unsigned)应该是毫秒ms.
*/
scanf("%s",str1);/*这两句无需你再输入,是对stdin流再扫描*/
scanf("%s",str2);/*这两句无需你再输入,是对stdin流再扫描*/
printf("%s\n",str1);
printf("%s\n",str2);
return 0;
}
输入:
I love you!
输出:
I
love
you!
好了,原因知道了,所以结论是:残留的信息 love you是存在于stdin流中,而不是在键盘缓冲区中。那么scanf()函数能不能完成这个任务?回答是:能!别忘了scanf()函数还有一个 %[] 格式控制符(如果对%[]不了解的请查看本文的上篇),请看下面的程序
:
#include<stdio.h>
int main(void)
{
char str[50];
scanf("%[^\n]",str);/*scanf("%s",string);不能接收空格符*/
printf("%s\n",str);
return 0;
}
问题二
键盘缓冲区残余信息问题
#include<stdio.h>
int main(void)
{
int a;
char c;
while(c!='N')
{
scanf("%d",&a);
scanf("%c",&c);
printf("a=%dc=%c\n",a,c);/*printf("c=%d\n",c);*/
}
return 0;
}
scanf("%c", &c);这句不能正常接收字符,什么原因呢?我们用printf("c = %d\n", c);将C用int表示出来,启用printf("c = %d\n", c);这一句,看看scanf()函数赋给C到底是什么,结果是c=10 ,ASCII值为10是什么?换行即\n.对了,我们每击打一下"Enter"键,向键盘缓冲区发去一个“回车”(\r),一个“换行"(\n),在这里\r被scanf()函数处理掉了(姑且这么认为吧^_^),而\n被scanf()函数“错误”地赋给了c.解决办法:可以在两个scanf()函数之后加getchar(),但是要视具体scanf()语句加那个,这里就不分析了,读者自己去摸索吧
。
#include<stdio.h>
int main(void)
{
int a;
char c;
while(c!='N')
{
scanf("%d",&a);
fflush(stdin);
scanf("%c",&c);
fflush(stdin);
printf("a=%dc=%c\n",a,c);
}
return 0;
}
版本1:运行出错的程序这里再给一个用“空格符”来处理缓冲区残余信息的示例:
#include<stdio.h>
int main(void)
{
int i;
char j;
for(i=0;i<10;++i)
scanf("%c",&j);/*这里%前没有空格*/
printf("%c",j);/*在输入十个字符之后*/
return 0;
}
版本2:使用了空格控制符后
#include<stdio.h>
int main(void)
{
int i;
char j;
for(i=0;i<10;++i)
scanf(" %c",&j);/*注意这里%前有个空格*/
printf("%c",j);/*在输入十个字符之后,验证打印出来的字符是否是自己输入的最后一个字符(即输入的第十个字符)*/
return 0;
}
我们输入:接着,我们运行看看,首先,运行第一个版本(错误的程序)
0 1 2 3 4 5 6 7 8 9
结果是一个空字符
再运行第二个版本(正确的程序)
同样输入:
0 1 2 3 4 5 6 7 8 9
这一次就显示字符9,故此程序正确。
那么为什么第二个程序就正确呢,原因何在,在%前面加一个空格就这么有用,答案是肯定的,就是%前面的空格在起作用,读者看看此文章的前面部分,在scanf的使用过程中应注意的问题中已经指出:“scanf()的格式控制串可以使用空白字符或其它非空白字符,使用空白字符会使scanf()函数在读操作中略去输入中的零个或多个空白字符。”
所以在%前面加上了空格(空格属于空白字符,此外还有像制表符等也属于空白字符),在输入过程中,将略去输入中的一个或多个空白字符,所以我们输入的0 1 2 3 4 5 6 7 8 9这些字符中的空白字符就被略去了,字符9也就正确的打印出来了,这样子解释,相信大家都看明白勒吧!
问题三
输入类型与格式化字符串不匹配导致stdin流的阻塞。
#include<stdio.h>
int main(void)
{
int a=0,b=0,c=0,ret=0;
ret=scanf("%d%d%d",&a,&b,&c);
printf("第一次读入数量:%d\n",ret);
ret=scanf("%d%d%d",&a,&b,&c);
printf("第二次读入数量:%d\n",ret);
return 0;
}
正确输入的话:我们定义了a,b,c三个变量来接受输入的内容,定义了变量ret来接收scanf函数的返回值。
但是当输入内容与格式换字符串不匹配时,结果会令人大跌眼镜(仔细分析会对scanf函数和stdin流有更深入的哦):
执行到第一个scanf时,当输入字符’b’的时候与ret=scanf("%d%d%d",&a,&b,&c);中的格式化字符串不匹配,stdin流被阻塞,scanf函数不在读取后面的部分,直接将1返回,表示只将stdin流中的1读入到了变量a中。
执行到第二个scanf时,字符’b’还是与格式化字符串不匹配,stdin流仍然被阻塞,所以没有提示输入,scanf函数将0返回。
将代码作如下修改,可以有力的证明上述结论。
#include<stdio.h>
int main(void)
{
int a=0,b=0,c=0,ret=0;
ret=scanf("%d%d%d",&a,&b,&c);
printf("第一次读入数量:%d\n",ret);
ret=scanf("%c%d%d",&a,&b,&c);
printf("第二次读入数量:%d\n",ret);
return 0;
}
当把第二个scanf函数内的格式化字符串改为”%c%d%d”时,运行结果如下:
执行到第一个scanf函数时,由于输入’b’的原因scanf函数直接返回1,stdin流阻塞。
执行到第二个scanf函数时,字符’b’与格式化字符串”%c%d%d”中的%c匹配,stdin流终于疏通,在输入6,则将变量a,b,c分别赋值为98(‘b’的ASCII码)、2、6,scanf函数返回3。
有上述问题可知,当使用scanf函数时,如果遇到一些匪夷所思的问题,在scanf函数后正确使用fflush(stdin);,清空输入缓冲区,可以解决很多问题。以本题为例:
#include<stdio.h>
int main(void)
{
int a=0,b=0,c=0,ret=0;
ret=scanf("%d%d%d",&a,&b,&c);
fflush(stdin);
printf("第一次读入数量:%d\n",ret);
ret=scanf("%d%d%d",&a,&b,&c);
fflush(stdin);
printf("第二次读入数量:%d\n",ret);
return 0;
}
运行结果:
问题解决。
问题四
如何处理scanf()函数误输入造成程序死锁或出错
#include<stdio.h>
int main(void)
{
int a,b,c;
scanf("%d,%d",&a,&b);
c=a+b;/*计算a+b*/
printf("%d+%d=%d",a,b,c);
return 0;
}
如上程序,如果正确输入a,b的值,那么没什么问题,但是,你不能保证使用者每一次都能正确输入,一旦输入了错误的类型,你的程序不是死锁,就是得到一个错误的结果,呵呵,这可能所有人都遇到过的问题吧?解决方法:scanf()函数执行成功时的返回值是成功读取的变量数,也就是说,你这个scanf()函数有几个变量,如果scanf()函数全部正常读取,它就返回几。但这里还要注意另一个问题,如果输入了非法数据,键盘缓冲区就可能还个有残余信息问题。正确的例程
:
#include<stdio.h>
int main(void)
{
int a,b,c;
while(scanf("%d%d",&a,&b)!=2)
fflush(stdin);
c=a+b;
printf("%d+%d=%d",a,b,c);
return 0;
}
fflush(stdin)这个方法在GCC下不可用。(在VC6.0下可以)补充
以下是 C99 对 fflush 函数的定义:
int fflush(FILE *stream);
如果stream指向输出流或者更新流(update stream),并且这个更新流
执行的操作不是输入,那么fflush函数将把任何未被写入的数据写入stream
指向的文件(如标准输出文件stdout)。否则,fflush函数的行为是不确定的。
C和C++的标准里从来没有定义过 fflush(stdin)。
fflush(NULL)清空所有输出流和上面提到的更新流。如果发生写错误,fflush
函数会给那些流打上错误标记,并且返回EOF,否则返回0。
由此可知,如果 stream 指向输入流(如 stdin),那么 fflush 函数的行为是不确定的。故而使用
fflush(stdin) 是不正确的,至少是移植性不好的。
可采用如下方法:
方法一:
/*此函数可以和scanf函数一起使用,但使用%c输入时要注意,即此函数只能用于缓冲区非空的情况*/
#include<stdio.h>
void flush()
{
char c;
while((c=getchar())!='\n'&&c!=EOF);
}
intmain(void)
{
int a,b,c;/*计算a+b*/
while(scanf("%d%d",&a,&b)!=2)
flush();
c=a+b;
printf("%d+%d=%d",a,b,c);
return 0;
}
方法二:
程序示例:
#include<stdio.h>
int main(void)
{
inti,c;
while(1)
{
printf("Pleaseinputaninteger:");
scanf("%d",&i);
if(feof(stdin)||ferror(stdin))
{
//如果用户输入文件结束标志(或文件已被读完),或者发生读写错误,则退出循环
//dosomething
break;
}
//没有发生错误,清空输入流。通过while循环把输入流中的余留数据“吃”掉
while((c=getchar())!='\n'&&c!=EOF);
//可直接将这句代码当成fflush(stdin)的替代,直接运行可清除输入缓存流
//使用scanf("%*[^\n]");也可以清空输入流,不过会残留\n字符。
printf("%d\n",i);
}
return 0;
}