周立功教授数年之心血之作《程序设计与数据结构》,电子版已无偿性分享到电子工程师与高校群体,经周立功教授授权,本公众号特对本书内容进行连载,愿共勉之。
第一章为程序设计基础,本文为1.8.1 字符常量。
>>>1.字符常量的引用
字符常量是使用一对单引号“''”包围起来的,比如,'O','编译器知道这个符号指的是字母O的ASCII值,即79。同样可以用' '指出空格,或用'9'指出数字9。常量'9'指的是一个字符,不应该与整数值9混淆。除非程序员能记住ASCII码表,否则任何人看到79都不会联想到字母O,而字符常量'O' 则可以直接传递它的意义。
在C语言中,字符能象整数一样计算,不需要特别的转换。基于此,既可以给一个字符加上一个整数,比如,字符c与整数n相加,即c+n表示c后面的第n个字符。也可以从一个字符减去一个整数,比如,表达式c-n表示c前面的第n个字符。还可以从一个字符减去另一个字符,比如,c1和c2都是字符,那么c1-c2表示两个字符的距离。
更进一步地,还可以比较两个字符,如果在ASCII表中,c1在c2前面,那么c1
if( ch >= '0' && ch <= '9' ) { … }
这样一来就将数字字符与ASCII码表中的其它字符区分开了。虽然标准C接口ctype.h提供了相应的函数,但如果你从头到尾实现它们,则有助于进一步深入了解它们的操作。如果ch是大写字母,返回它对应的小写字母,否则返回ch本身,详见程序清单 1.35。
程序清单1.35 tolower()函数范例程序
1 char tolower(char ch)
2 {
3 if( ch >= 'A' && ch <= 'Z' ){ //标识大写字母
4 return (ch + ('a' - 'A'));
5 }else{
6 return (ch);
7 }
8 }
>>>2. 字符的输入输出
虽然转换符%c允许scanf()函数和printf()函数对一个单独的字符进行读写操作。比如:
char ch;
scanf("%c", &ch);
printf("%c", ch);
但在读入字符前,scanf()函数不会跳过空格符,即会将空格作为字符读入变量ch。为了解决这个问题,则必须在%c的前面加一个空格:
scanf(" %c", &ch);
虽然scanf()函数不会跳过空格符,却很容易检测到读入的字符是否为换行符'\n'。比如:
while(ch != '\n'){
scanf("%c", &ch);
}
当然也可以调用getchar()和putchar()读写一个单独的字符,它们是在stdio.h中定义的宏,分别用于从键盘读取数据和将字符打印到屏幕上。虽然宏和函数在技术上存在一些区别,但它们的用法是一样的。比如:
int getchar(void);//输入一个字符
int putchar(int ch);//输出一个字符
getchar()函数不带任何参数,它从输入队列中返回一个字符。比如,下面的语句读取一个字符输入,并将该字符的值赋给变量ch:
ch = getchar();
该语句与下面的语句等效:
scanf("%c", &ch);
putchar()函数打印它的参数,比如,下面的语句将之前赋给ch的值作为字符打印出来:
putchar(ch);
该语句与下面的语句效果相同:
printf("%c", ch);
由于这些函数只处理字符,因此它们比scanf()和printf()函数更快,这两个函数通常定义在stdio.h中,实际上它们是预处理宏,不是真正的函数。虽然这些宏看起来很简单,但有时出了问题,却找不出原因。比如:
char ch1, ch2;
ch1 = getchar();
ch2 = getchar();
printf("%d %d\n", ch1, ch2);
此时,如果输入字符'a',而打印结果却是“97,10”。因为从键盘输入一个字符后,就打印出了结果,还没有输入第二个字符程序就结束了。由于键盘输入一次结束后,会将数据存储在一个被称为缓冲区的临时存储区,按下Enter键后程序才可使用用户输入的字符,因此scanf()和getchar()也是从输入流缓冲区中取值的,而人们常常会产生这样的错觉,误以为它们是从键盘缓冲区取值的。实际上,数据是通过cin函数直接从输入流缓冲区中取走的,所以,当缓冲区中有残留数据时,cin函数会直接读取这些残留数据而不会请求键盘输入。
这里的10恰好是Enter键输入的换行符'\n',当读取数据遇到换行符'\n'结束时,换行符会一起读入输入流缓冲区,所以第一次接受输入时,取走字符后会留下字符'\n',于是第二次直接从缓冲区中将\n取走。
为何要有缓冲区呢?首先,将若干字符作为一个块进行传输比逐个发送这些字符节约时间。其次,如果用户打错字符,可以直接通过键盘修正错误。当最后按下Enter键时,传输的是正确的输入。虽然输入缓冲区的好处很多,但在某些交互式程序中也需要无缓冲区输入。比如,在游戏中,如果希望按下一个键就执行相应的命令,因此缓冲输入和无缓冲输入各有各的用武之地,但本书假设所有的输入都是缓冲输入。
缓冲分为两类:完全缓冲I/O和行缓冲I/O,完全缓冲输入指的是当缓冲区被填满时才刷新缓冲区,内容被发送到目的地,通常出现在文件输入中。缓冲区的大小取决于系统,常见的大小为512字节和4096字节。行缓冲区I/O指的是在出现换行符时刷新缓冲区,键盘输入通常是行缓冲区输入,所以在按下Enter键后才刷新缓冲区。
getchar()读取每个字符,包括空格、制表符和换行符;而scanf()在读取数字时,则会跳过空格、制表符和换行符。虽然这两个函数都很好用,但不能混合使用。
虽然putchar()的参数ch定义为int类型,但实质上它接收的是一个char类型字符,因为在putchar()内部,系统会将ch强制转换为char类型后再使用。如果字符输出成功,则putchar()返回输出的字符((char)ch),而不是输入的参数ch;如果不成功,则返回预定义的常量EOF(end of file,文件结束),EOF是一个整数。
getchar()没有输入参数,其返回值为int型,而不是char型。这里需要区分文件中的有效数据和输入结束符,当有字符可读时,getchar()不会返回文件结束符EOF,所以
ch = getchar() != EOF //相当于ch = (getchar() != EOF)
取值为true,变量ch被赋值为1。
当程序没有输入时,则getchar()返回文件结束符EOF,即表达式取值为false,此时变量ch被赋值为0,程序结束运行。如果将getchar()函数的返回值定义为int型,则既能存储任何可能的字符,也能存储文件结束符EOF,将输入复制到输出的例程序详见程序清单1.36。
程序清单1.36将输入复制到输出范例程序
1 #include
2 int main(int argc, char *argv[])
3 {
4 int ch;
5
6 while((ch = getchar()) != EOF){
7 putchar(ch);
8 }
9 return 0;
10 }
当然,也可以用getchar()的另一种惯用法替代程序清单1.36(6):
while((ch = getchar()) != '\n')
即将读入的一个字符与换行符比较,如果测试结果为true,则执行循环体,接着重复测试循环条件,再读入一个新的字符,同时getchar()用于搜索字符和跳过字符等效。比如:
while((ch = getchar()) == ' ')
当循环终止时,变量ch将包含getchar()遇到的第一个非空字符。
do-while循环远比for和while循环用得小,因为它至少需要执行循环体一次,且在代码的最后而不是开始执行条件循环测试。逻辑条件应该出现在它们所“保护”的代码之前,这也是if、while和for的工作方式。通常阅读代码的习惯是从前向后,当使用do/while循环时,需要对这段代码读两次。同时,这种方式在很多情况下是不正确的,比如:
? do{
? ch = getchar();
? putchar(ch);
? }while(ch != EOF);
由于测试被放在对putchar()的调用之后,因此该代码无端地多写了一个字符。只有在某个循环体必须至少执行一次的情况下,使用do-while循环才是正确的。
另一个让人迷惑的是,do/while循环中的contiune语句:
do{
continue;
}while(false);
它会永远循环下去还是只执行一次?虽然它只会循环一次,但大多数人都会想一想。C++的开创者Bjarne Stroustrup是这样说的,“do语句是错误和困惑的来源,我倾向于将条件放在前面我能看到的地方,避免使用do语句。”
-
数据结构
+关注
关注
3文章
573浏览量
40127
原文标题:周立功:字符能像整数一样计算
文章出处:【微信号:ZLG_zhiyuan,微信公众号:ZLG致远电子】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论