- 相關(guān)推薦
C語言編程建議和技巧
Rob Pike 是谷歌公司最著名的軟件工程師之一,曾是貝爾實(shí)驗(yàn)室 Unix 開發(fā)團(tuán)隊(duì)成員,Plan 9 操作系統(tǒng)開發(fā)的主要領(lǐng)導(dǎo)人,Inferno 操作系統(tǒng)開發(fā)的主要領(lǐng)導(dǎo)人。他是締造 Go 語言和 Limbo 語言的核心人物。下面,就和小編一起來看一看C語言編程建議和技巧,希望對大家有幫助!
介紹
Kernighan和Plauger編寫的《The Elements of Programming Style》,是一本很重要而且公認(rèn)有很大影響力的書。但有時(shí)候我覺得對于書中的簡潔規(guī)則,可以看做是一種好的烹飪方法,而不是想簡潔的表達(dá)一種哲學(xué)思維。倘若這本書聲稱應(yīng)該有意義地選擇變量名稱,那么難道他們文章中對變量的命名更好?難道MaximumValueUntilOverflow比maxval更好嗎?我不這么認(rèn)為。
下面是一篇簡短的文章,總體上鼓勵在編程時(shí)應(yīng)有清晰的哲學(xué)思維,而不是給予硬性規(guī)則。我并不希望你們能認(rèn)可所有的東西,因?yàn)樗鼈冎皇怯^點(diǎn),觀點(diǎn)會隨著時(shí)間的變化而變化?墒,如果不是直到現(xiàn)在把它們寫在紙上,長久以來這些基于許多經(jīng)驗(yàn)的觀點(diǎn)一直積累在我的頭腦中。因此希望這些觀點(diǎn)能幫助你們,了解如何規(guī)劃一個(gè)程序的細(xì)節(jié)。(我還沒有看到過一篇講關(guān)于如何規(guī)劃整個(gè)事情的好文章,不過這部分可以是課程的一部分)要是能發(fā)現(xiàn)它們的特質(zhì),那很好;要是不認(rèn)同的話,那也很好。但如果能啟發(fā)你們思考為什么不認(rèn)同,那樣就更好了。在任何情況下,都不應(yīng)該照搬我所說的方式進(jìn)行編程;要用你認(rèn)為最好的編程方式來嘗試完成程序。請一以貫之而且毫不留情的這么做。
歡迎您的評論。
排版問題
程序是一種出版物。意味著程序員們會先閱讀(也許是幾天、幾周或幾年后的你自己閱讀),最后才輪到機(jī)器。機(jī)器的快樂就是程序能編譯,機(jī)器才不在乎程序?qū)懙挠卸嗝雌,可是人們?yīng)該保持程序的美觀。有時(shí)人們會過度關(guān)心:用漂亮的打印機(jī)呆板地打印出漂亮的輸出,而這些輸出只是將所有介詞用英文文本以粗體字體凸顯出來,都是些與程序無關(guān)的細(xì)節(jié)。雖然有很多人認(rèn)為程序就應(yīng)該像 Algol68 所描述的一樣(有些系統(tǒng)甚至要求照搬該風(fēng)格編寫程序),可清晰的程序不會因?yàn)檫@樣的呈現(xiàn)而變得更清晰,只會使糟糕的程序變得更可笑。
對于清晰的程序來說,排版規(guī)范一向都是至關(guān)重要的。當(dāng)然,眾所周知最有用的是縮進(jìn),但是當(dāng)墨水遮蓋了意圖時(shí),就會控制住排版。因此即便堅(jiān)持使用簡單的舊打字機(jī)輸出,也該意識到愚蠢的排版。避免過度修飾,比如保持注釋的簡潔和靈活。通過程序整齊一致地說出想表達(dá)的。接著往下看。
變量命名
對于變量名稱,長度并不是名稱的價(jià)值所在,清晰的表達(dá)才是。不常用的全局變量可能會有一個(gè)很長的名稱,像maxphysaddr。在循環(huán)中每一行所使用的數(shù)組索引,并不需要取一個(gè)比i更詳盡的名字。取index或者elementnumber會輸入更多的字母(或調(diào)用文本編輯器),并且會遮蓋住計(jì)算的細(xì)節(jié)。當(dāng)變量名稱很長時(shí),很難明白發(fā)生了什么。在一定程度上,這是排版問題,看看下面
for(i=0to100)
array[i]=0;
vs.
for(elementnumber=0to100)
array[elementnumber]=0;
現(xiàn)實(shí)例子中的問題會變得更糟。所以僅需把索引當(dāng)成符號來對待。
指針也需要合理的符號。np僅僅只是作為指針 nodepointer 的助記符。如果一貫都遵從命名規(guī)范,那么很容易就能推斷出 np 表示“節(jié)點(diǎn)指針”。在下一篇文章中會提到更多。
同時(shí)在編程可讀性的其它方面,一致性也是極其重要的。假使變量名為 maxphysaddr,則不要給同級關(guān)系的變量取名 lowestaddress。
最后,我傾向于「最小長度」但「最大信息量」的命名,并讓上下文補(bǔ)齊其余部分。例如:全局變量在使用時(shí)很少有上下文幫助理解,那么它們的命名相對而言更需要令人易懂。因此我稱 maxphyaddr (不是 MaximumPhysicalAddress)作為一個(gè)全局變量名,對于在本地定義和使用的指針來說 np 并不一定是 NodePoint。這是品味的問題,但品味又與清晰度相關(guān)。
我避免在命名時(shí)嵌入大寫字母;在我經(jīng)驗(yàn)豐富的雙眼中,它們的閱讀舒適性太別扭了,像糟糕的排版一樣令人心煩。
指針的使用
C 語言不同尋常,因?yàn)樗试S指針指向任何事物。指針是鋒利的工具,像任何這樣的工具一樣,使用得當(dāng)可以產(chǎn)生令人愉悅的生產(chǎn)力,但使用不當(dāng)也可以造成極大的破壞(在寫這篇文章的前幾天,我把木工鑿插到拇指里了)。指針在學(xué)術(shù)界的名聲不太好,因?yàn)樗kU(xiǎn)了,莫名其妙地就變得糟糕的不行。但我認(rèn)為它是強(qiáng)大的符號,它可以幫助我們清楚地自我表達(dá)。
思考:當(dāng)有指針指向?qū)ο髸r(shí),對于那個(gè)對象,確切地說它只是名稱,其它什么也不是。聽起來很瑣碎,但看看下面的兩個(gè)表達(dá)式:
np
node[i]
第一個(gè)指向一個(gè) node(節(jié)點(diǎn)),第二個(gè)計(jì)算為(可以說)同一個(gè) node。但第二種形式是不太容易理解的表達(dá)式。這里解釋一下,因?yàn)槲覀儽仨氁?node 是什么,i是什么,還要知道i和 node 與周圍程序之間相關(guān)(可能不是很詳細(xì))的規(guī)則是什么。孤立的表達(dá)式并不能說明i是 node 的有效索引,更不用提是我們想要元素的索引。如果i、j和k都是 node 數(shù)組中的索引將很容易出差錯,而且連編譯器都不能幫助找出錯誤。當(dāng)給子程序傳參數(shù)時(shí),尤其容易出錯:指針只是一個(gè)單獨(dú)的參數(shù);但在接收的子程序中必須認(rèn)為數(shù)組和索引是一體的。
計(jì)算為對象表達(dá)式本身,比該對象的地址更不易察覺,而且容易出錯。正確使用指針可以簡化代碼:
parent->link[i].type
vs.
lp->type.
如果想取下一個(gè)元素的 type 可以是
parent->link[++i].type
或
(++lp)->type.
i前移,但其余的表達(dá)式必須保持不變;用指針的話,只需要做一件事,就是指針前移。
把排版因素也考慮進(jìn)來。對于處理連續(xù)的結(jié)構(gòu)體來說,使用指針比用表達(dá)式可讀性更好:只需要較少的筆墨,而且編譯器和計(jì)算機(jī)的性能消耗也很小。與此相關(guān)的問題是,指針類型會影響指針正確使用,這也就允許在編譯階段使用一些有用的錯誤檢測,來檢查數(shù)組序列不能分開。而且如果是結(jié)構(gòu)體,那么它們的標(biāo)簽字段就是其類型的提示。因此
np->left
是足以讓人明白的。如果是索引數(shù)組,數(shù)組將取一些精心挑選的名字,而且表達(dá)式也會變得更長:
node[i].left.
此外,由于例子變得越來越大,額外的字符更加讓人惱火。
一般來說,如果發(fā)現(xiàn)代碼中包含許多相似并復(fù)雜的表達(dá)式,而且表達(dá)式計(jì)算為數(shù)據(jù)結(jié)構(gòu)中的元素,那么明智地使用指針可以消除這些問題?紤]一下
if(goleft)
p->left=p->right->left;
else
p->right=p->left->right;
看起來像利用復(fù)合表達(dá)式表示p。有時(shí)這值得用一個(gè)臨時(shí)變量(這里的 p)或者把運(yùn)算提取成一個(gè)宏。
過程名稱
過程名稱應(yīng)該表明它們是做什么的,函數(shù)名稱應(yīng)該表明它們返回什么。函數(shù)通常在像if這樣的表達(dá)式使用,因此可讀性要好。
if(checksize(x))
是沒有太大幫助的,因?yàn)椴荒芡茢喑?checksize 錯誤時(shí)返回 true,還是非錯誤時(shí)返回。相反
if(validsize(x))
使這點(diǎn)能清晰表達(dá),并且在常規(guī)使用中將來也不大可能出錯。
注釋
這一個(gè)微妙的問題,需要自己體會和判斷。由于一些原因,我傾向于寧可清除注釋。第一,假如代碼清晰,并且使用了規(guī)范的類型名稱和變量名稱,應(yīng)該從代碼本身就可以理解。第二,編譯器不能檢查注釋,因此不能保證準(zhǔn)確,特別是代碼修改過以后。誤導(dǎo)性的注釋會非常令人困惑。第三,排版問題:注釋會使代碼變得雜亂。
但有時(shí)我會寫注釋,像下文一樣僅僅只是把它們用于介紹。例如:解釋全局變量的使用和類型(我總是在龐大的程序中寫注釋);作為一個(gè)不尋;蛘哧P(guān)鍵過程的介紹;或標(biāo)記出大規(guī)模計(jì)算的一節(jié)。
糟糕注釋風(fēng)格,有一個(gè)典型的例子:
i=i+1;/* Add one to i */
還有更爛的做法:
/**********************************
**
*Add one to i*
**
**********************************/
i=i+1;
先不要嘲笑,等到在現(xiàn)實(shí)中看到再去吧。
或許除了諸如重要數(shù)據(jù)結(jié)構(gòu)的聲明(對數(shù)據(jù)的注釋通常比對算法的更有幫助),這樣至關(guān)重要部分之外,需要避免對注釋的“可愛”排版和大段的注釋;基本上最好就不要寫注釋。如果代碼需要靠注釋來說明,那最好的方法是重寫代碼,以便能更容易地理解。這就把我們帶到了復(fù)雜度。
復(fù)雜度
許多程序過于復(fù)雜,比需要有效解決的問題更加復(fù)雜。這是為什么呢?大部分是由于設(shè)計(jì)不好,但我會跳過這個(gè)問題,因?yàn)檫@個(gè)問題太大了。然而程序往往在微觀層面就很復(fù)雜,有關(guān)這些可以在這里解決。
規(guī)則 1:不要斷定程序會在什么地方耗費(fèi)運(yùn)行時(shí)間。
瓶頸總是出現(xiàn)在令人意想不到的地方,直到證實(shí)瓶頸在哪,不要試圖再次猜測并加快運(yùn)行速度。
規(guī)則 2:估量(measure)
在沒有對代碼做出估量之前不要優(yōu)化速度,除非發(fā)現(xiàn)最耗時(shí)的那部分代碼,要不也不要去做。
規(guī)則 3:當(dāng) n 很小時(shí)(通常也很。,花哨的算法運(yùn)行很慢。
花哨算法有很大的常數(shù)級別復(fù)雜度。在你確定 n 總是很大之前, 不要使用花哨算法。(即使假如 n 變大,也優(yōu)先使用規(guī)則 2).例如,對于常見問題,二叉樹總比伸展樹高效。
規(guī)則 4:花哨的算法比簡單的算法更容易有 bug,而且實(shí)現(xiàn)起來也更困難
盡量使用簡單的算法與簡單的數(shù)據(jù)結(jié)構(gòu)。
以下幾乎是所有實(shí)際程序中用到的數(shù)據(jù)結(jié)構(gòu):
數(shù)組
鏈表
哈希表
二叉樹
當(dāng)然也必須要有把這些數(shù)據(jù)結(jié)構(gòu)靈活結(jié)合的準(zhǔn)備,比如用哈希表實(shí)現(xiàn)的符號表,其中哈希表是由字符型數(shù)組組成的鏈表。
規(guī)則 5:以數(shù)據(jù)為核心
如果選擇了適當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)并把一切都組織得很有條理性,算法總是不言而喻的。編程的核心是數(shù)據(jù)結(jié)構(gòu),而不是算法。(參考 Brooks p. 102)
規(guī)則 6:就是沒有規(guī)則 6
數(shù)據(jù)編程
不像許多 if 語句,算法或算法的細(xì)節(jié)通常以緊湊、高效和明確的數(shù)據(jù)進(jìn)行編碼。眼前的工作可以編碼,歸根到底是由于其復(fù)雜性都是由不相干的細(xì)節(jié)組合而成。分析表是典型例子,它通過一種解析固定、簡單代碼段的形式,對編程語言的語法進(jìn)行編碼。有限狀態(tài)機(jī)特別適合這種處理形式,但是幾乎任何涉及到對構(gòu)建數(shù)據(jù)驅(qū)動算法有益的程序,都是將某些抽象數(shù)據(jù)類型的輸入“解析”成序列,序列會由一些獨(dú)立“動作”構(gòu)成。
也許這種設(shè)計(jì)最有趣的地方是表結(jié)構(gòu)有時(shí)可以由另一個(gè)程序生成(經(jīng)典案例是解析生成器)。有個(gè)更接地氣的例子,假如操作系統(tǒng)是由一組表驅(qū)動,這組表包含連接 I/O 請求到相應(yīng)設(shè)備驅(qū)動的操作,那么可以通過程序“配置“系統(tǒng),該程序可以讀取到某些特殊設(shè)備與可疑機(jī)器連接的描述,并打印相應(yīng)的表。
數(shù)據(jù)驅(qū)動程序在初學(xué)者中不常見的原因之一是由于 Pascal 的專制。 Pascal 像它的創(chuàng)始人一樣,堅(jiān)信代碼要和數(shù)據(jù)分開。因而(至少在原始形式上)無法創(chuàng)建初始化的數(shù)據(jù)。與圖靈和馮諾依曼的理論背道而馳,這些理論可都是定義存儲計(jì)算機(jī)的基本原理。代碼和數(shù)據(jù)是一樣的,或至少可以算是。還能怎樣解釋編譯器的工作原理呢?(函數(shù)式語言對 I/O 也有類似的問題)
函數(shù)指針
Pascal 專制的另一個(gè)結(jié)果是初學(xué)者不使用函數(shù)指針。(在 Pascal 中沒有把函數(shù)作為變量) 用函數(shù)指針來處理編碼復(fù)雜度會有一些令人感興趣的地方。
指針指向的程序有一定的復(fù)雜度。這些程序必須遵守一些標(biāo)準(zhǔn)協(xié)議,像要求一組都是相同調(diào)用的程序就是其中之一。除此之外,所要實(shí)現(xiàn)的只是完成業(yè)務(wù),復(fù)雜度是分散的。
有個(gè)協(xié)議的主張是既然所有使用的功能相似,那么它們的行為也必須相似。這對簡單的文檔、測試、程序擴(kuò)展和甚至使程序通過網(wǎng)絡(luò)分布都有幫助——遠(yuǎn)程過程調(diào)用可以通過該協(xié)議進(jìn)行編碼。
我認(rèn)為面相對象編程的核心是清晰使用函數(shù)指針。規(guī)定好要對數(shù)據(jù)執(zhí)行的一系列操作,以及對這些操作響應(yīng)的整套數(shù)據(jù)類型。將程序合攏到一起最簡單的方法是為每種類型使用一組函數(shù)指針。簡而言之,就是定義類和方法。當(dāng)然,面向?qū)ο笳Z言提供了更多更漂亮的語法、派生類型等等,但在概念上幾乎沒有提出額外的東西。
數(shù)據(jù)驅(qū)動程序與函數(shù)指針的結(jié)合,變成了一種表現(xiàn)令人驚訝的工作方法。根據(jù)我的經(jīng)驗(yàn),這種方法經(jīng)常會產(chǎn)生驚喜的結(jié)果。即使沒有面向?qū)ο笳Z言,無需額外的工作也可以獲得 90% 的好處,并且能更好地管理結(jié)果。我無法再推薦出更高標(biāo)準(zhǔn)的實(shí)現(xiàn)方式。我所有的程序都是由這種方式組織管理,而且經(jīng)過多次開發(fā)后都相安無事——遠(yuǎn)遠(yuǎn)優(yōu)于缺少約束的方法。也許正如所說:從長遠(yuǎn)來看,約束會帶來豐厚的回報(bào)。
包含文件
簡單規(guī)則:包含(include)文件時(shí)應(yīng)該永遠(yuǎn)不要嵌套包含。
如果聲明(在注釋或隱式聲明里)需要的文件沒有優(yōu)先包含進(jìn)來,那么使用者(程序員)要決定包含哪些文件,但要以簡單的方式處理,并采用避免多重包含的結(jié)構(gòu)。多重包含是系統(tǒng)編程的禍根。將文件包含五次或更多次來編譯一個(gè)單獨(dú)的 C 源文件的事情屢見不鮮。Unix 系統(tǒng)中 /usr/include/sys 就用了這么可怕的方式。
說到 #ifdef,有一個(gè)小插曲,雖然它能防止讀取兩次文件,但實(shí)際上經(jīng)常用錯。#ifdef 是定義在文件本身中,而不是文件包含它。結(jié)果是常常導(dǎo)致讓成千上萬不必要的代碼通過詞匯分析器,這是(優(yōu)秀編譯器中)耗費(fèi)最大的階段。
只需遵從以上簡單規(guī)則。
【 C語言編程建議和技巧】相關(guān)文章:
C語言高效編程的小技巧09-13
C語言高效編程的4個(gè)小技巧10-27
C語言編程基礎(chǔ)08-17
C編程語言概述10-20
C語言入門什么是編程語言10-12
C語言socket編程的方法10-07
如何學(xué)習(xí)C語言編程10-28
c語言編程軟件有哪些09-09
C語言高效編程的幾個(gè)絕招09-11