close
                         右下有投票

右下有投票



右下有投票

題目:冪次定律與總大部落格人口結構的猜想—並介紹一本好書

一、介紹一本談冪次定律(power law)的好書

先從介紹這一本書談起吧。“改變世界的簡單法則” 
馬克・布坎南著 陳雅雲譯 究竟出版社出版 
   
         這是一本科普書籍,他的主題是在介紹冪次定律。
        1914年發生了第一次世界大戰。這是一個偶然的異常事件嗎?如果不是,奧匈帝國斐迪南大公在塞拉耶弗被刺身亡,就不會發生這種後果?

        三億年前,恐龍以及數十萬的物種發生了大滅絕。這是一個偶然的異常事件嗎?如果不是小行星撞到了地球,就不會發生這種可怕的事情?

         紐約是世界上人口最多的都市。所以紐約是一個異常優秀的地點嗎,他有優良的港灣位於河流的出海口,背後有廣大的平原,腹地氣候適中,所以可以成為世界第一大都市?

        XXX是某國首富的企業家,所以XXX是一個異常優秀的人物嗎?他有一般人所沒有的特質,聰明、有決斷力、意志堅強、刻苦耐勞、知人善任、有群眾魅力,所以特別成功?

       以上都提到”異常”這兩個字。既然是異常,當然就應該找的出與”平常”不同之處,就應該找的出其發生的原因。所以上面提出的異常事件,我們都似乎找出了一些原因。真的是這些原因嗎?

        1995年日本神戶的大地震是一個罕見的異常事件嗎?或者說,歷史上有名的大地震,都是地質上的異常現象所引起的嗎?如果是這樣的話,為何地球科學家在已經可以相當準確的預測未來天氣的今日,卻對於同樣是地球環境現象的地震預測一籌莫展呢?每一次大地震來臨之前,都是一片寧靜,毫無徵兆,這真的只是科學家還沒有發現這些”徵兆”是什麼嗎?

        1987年10月19日黑色星期一,華爾街股市一天之內跌掉了五分之一,創造了歷史上最大的跌幅,其幅度甚至超過1929年的大崩盤。這是一個異常的事件嗎?如果是的話,那應該找的到原因吧。是經濟大利空嗎?可是不過是不到一個月之前的9月23日,報紙上仍是各種好消息,當天道瓊指數還創下史上最高漲幅75.23點。即使大崩盤前的幾個交易日,10月14、15、16日三天,確實都是下跌,但是其跌幅和歷史上千千萬萬次的連續幾天下跌比較起來,完全看不出有任何的不同。

        像上面這樣牽涉到事件的”異常大的規模”的問題,出現在許許多多看似不相關的領域裡面。這些領域的專家們分別在其專業領域內,拼命想找出這些異常事件的原因。然而這些大規模的事件,真的是異常或罕見的事件嗎?近年來科學家漸漸發現到,有一種機率分布叫做冪次定律。如果事件的規模的分布是屬於這一種冪次定律時,那麼一些極端的情形也就不那麼罕見。

         什麼叫做冪次定律呢?可以用一句簡單的話來敘述,那就是:
       ”事件的規模倍增的時候,其發生的機會按照一個固定的比例減少。”


        這個比例是多少並不重要,重要的是這個分佈的形式,也就是這個比例在某個特定的系統中是固定的而不是變動的。

        寫的簡潔一點就是”規模變為X倍的時候發生的機會減為1/N”。這個X和N隨各種不同系統而有其特定的數值。
以財富的分布為例吧。這本書上有這一段話:”如果計算在美國身價十億和五億的人數,將會發現後者是前者的四倍。而身價二億五千萬的人數,又是身價五億者的四倍,依此類推。如果這個特殊模式適用於某一時刻由某一政府所統治的國家,或許我們可以視之為是政府政策下的奇特現象。但是我們卻發現英國美國日本等所有國家都有相同的模式。”

        又如城市的大小:1977年幾位學者研究美國2400個最大城市的資料。人口最多的是紐約市(九百多萬) 。人口只有它的一半的城市,則有四個,辛辛那提就是其一(人口四百多萬) 。而人口為辛辛那提這種等級的一半的城市,數目又增為四倍,依此類推,一直到人口只有一萬左右的城市,這個完美的模式仍然適用。研究全球1700個最大的城市以及瑞士1300個社區的人口,發現這個冪次定律仍然適用。這個冪次定律最大的意義是:”美國或任何地方的城市,都沒有「典型」的大小,而且極大的城市之所以會興起,背後也沒有什麼特殊的歷史地理條件”。”冪次定律顯示,我們無法在一個城鎮開始之初,即預測他最後會發展成多大的城市。紐約、墨西哥市或東京在萌芽時期,沒有任何讓它們注定成為大城市的因素或特別之處。如果歷史可以倒轉,重新來過,世上無疑仍會有大城市,但可能是在不同的地點,也有不同的名稱。但是即便如此,城市的冪次定律模式仍會相同。”(玩過文明帝國或模擬城市(總按:我最愛的game)之類遊戲的網友,對這一段話應該深表認同吧。)

        再看股市的價格波動:1998年波士頓大學的史坦利研究標準普爾五百指數在1984-1996年之間每一分鐘的時距內的漲跌幅度,發現漲跌幅度倍增時,發生此種幅度的漲跌的機率就變為十六分之一。從很小到很大的漲跌幅之間,這個比例一直維持大致不變,也就是符合冪次定律的形式。”若某一事物符合冪次定律,則就該事物而言,發生極端事件的可能性不會很低。事實上用極端一詞來指稱它們,甚至是不恰當的。”換句話說,股市的漲跌幅度沒有典型的大小,也不該有所謂的超級大崩盤這種觀念,更不必為這些所謂的大崩盤去找尋什麼理由。事實上,把上述研究的時距改為每小時或每天來研究其漲跌幅,或改為研究一千種個股的漲跌幅,都同樣得到冪次定律的特性。

        為什麼這麼多不同的系統,竟然都不約而同的符合同一種分布的規律呢?原來可以從這些系統生成演變的過程去探索。如果一個系統有下列兩個性質:(1)規模的大小會隨機發生微小的改變。(2)規模越大的時候,變的更大的機會就會增加。那麼不需要任何其他的原因,只需要靠機運,只要時間夠久,就自然會有人越變越大而出現一些超級大咖,而整個族群的大小分布大體上就很容易會呈現冪次定律的分布了。這種”規模越大越容易變更大”的系統是否很常見呢?事實上簡直太多了。所以冪次定律才會這麼常見。例如:

        財富:有錢人賺錢,是否比窮人容易的多?主力大戶炒股,是否比散戶更容易獲勝?即使所有人天賦能力都相同,一開始的財富也相同,但若因為機率的關係,其中有些人的財富有微小的增加,則這些人賺更多錢的機率就比其他人高了一些,於是就會越來越有錢。當有一天他終於成為億萬富翁的時候,回過頭來追索他成功的原因,當然會有各種各樣的說法,說此人特別聰明啦、有毅力不怕辛苦啦、眼光獨到啦、知人善任啦…,誰知其實一切不過是,最初的時候,因為機率使他連續幾次偏離到有利成長的一方罷了。如果同樣這些人,重頭開始玩,最後仍然會有一批人變為贏家超級大富翁,可是可能會是完全不同的一批人。有玩過大富翁遊戲的,應該都能體認我這一段話的意思吧。所以一些人玩了一段時間以後,其財富的分部會大致上符合冪次定律。

        都市:越大的都市,機能越完全,也就會吸引更多人前往。所以都市的規模有”越大越容易變更大”的特性,也就造就了一些超級大都市。也因此都市規模的分布符合冪次定律是合理的。

       地震:地殼隨時都在發生各種規模的摩擦。摩擦越大累積的能量越多,也越容易引發更大的摩擦,所以時間夠久就會發生超級大地震。把一大段時間中地震的規模作一個統計,會發現其分布確實遵循冪次定律。

        戰爭:人類社會隨時在發生各種衝突。從死亡一兩人的個人爭執,死亡數人的幫派械鬥,死亡數十人的村莊火併,到死亡數百人的族群鬥爭。但是衝突的規模越大,爭端近一步擴大的機會也就越大。所以只要時間夠久,次數夠多,只憑機率,不必任何其他的理由,就可以發生超大規模的戰爭。把過去數百年來所發生的戰爭,把死亡人數當作其規模大小的指標,加以統計,發現其分布果然符合冪次定律。

        生物滅絕:數十億年來,一直有生物隨機的在滅絕。當同時滅絕的生物種類越多的時候,對生態的影響就越大,也就越容易造成更多物種滅絕。所以根據化石紀錄,把過去發生的滅絕,以每單位時間滅絕的物種數目作為其規模的指標,統計起來,發現其分布果然符合冪次定律。

        股市漲跌:每一天股市價格都在波動。但是每當股市漲越多的時候,就越容易吸引更多人轉為樂觀而看多、而買進,而使漲勢更強。跌的時候也一樣。也就是股市漲跌的幅度,符合上面所說的,幅度越大越容易變更大的特性。所以只要時間夠久,不需要任何理由,自然就會發生超大的漲幅或跌幅。所以股市漲跌幅的分布符合冪次定律,並不令人意外。
書中還舉了很多其他的例子,很多是物理現象,我就不一一介紹了。

        書籍介紹完了(當然也加入了一些我個人的心得)。有興趣的人去讀一讀原書,當能體會更深。
        由以上種種例子可以知道,冪次定律是多麼頻繁的出現在我們週遭的各種系統之中。尤其是關涉到群聚的行為,特別容易有大者越大的特性,冪次定律也就屢見不鮮。這提供我們在面對一個沒有接觸過的系統時,很好的思考方向。如果有理由可以相信它具有大者容易更大的特性,我們就不妨假設它是一個呈現冪次定律分布的系統,而可以來分析它的結構。現在我們就來看看總大的部落格。

            二、總幹事部落格人口結構的猜想

       部落格的瀏覽次數,顯然是符合上面所說的大者越大的特性的。一位網友來此部落格瀏覽越多次,就成為常客,就越喜歡上來,越容易增加更多的瀏覽次數。如果大家同意這種說法有其道理,那麼我們就不妨大膽假設總大部落格的瀏覽次數分布會成為一個冪次定律分布。以此為基礎,也許可以來猜想來分析其人口結構。當然即便如此,我們所能掌握的資料還是太少,所以下面的計算帶有許多推測的成分。但是至少這可以提供一個思考的方向。前一陣子進行投票問要不要買總大的書,投票率似乎不是很令人滿意,大家都很緊張。如果我們能稍微明白到底這個部落格的瀏覽人口結構是怎樣的,其行為模式是如何,也許就比較容易面對這個問題。

        我們現在只有一個確定的資料,就是本部落格總瀏覽次數大概在600多萬次左右。而每日上線人數在前一陣子大概都有四五萬人次。台灣最大的BBS站ptt站,每天大概都有五萬多人掛在上面。幾個月前,其負責人接受媒體訪問,有提到實際有在該站註冊的人數是75萬人左右。既然總大的部落格每日上線人數比ptt略少一點,所以我們姑且推估曾來過總大部落格的人數大約是六七十萬人。(這個人數的意義相當於ptt的註冊人數。有註冊就表示至少曾上站一次,但很多都是免洗帳號,註冊完就不曾再上站,或只用一次就不用的帳號。)(這其實是個很粗略的推測。如果有人能有更好的推論基礎,不妨共同來討論。)我們把這些網友依照來瀏覽過的次數分成四個等級如下:

A級網友 瀏覽過1-10次者
B級網友 瀏覽過10-100次者
C級網友 瀏覽過100-1000次者
D級網友 瀏覽過1000次以上者(總按:屬於D級的網友自動報上名來..哈)

        若符合冪次定律,則上面每個等級的人數是呈固定比率減少的。配合總瀏覽次數六百多萬及上面假設總人口六七十萬,我們可以推測其人口分布如下:

A級網友(1-10次 平均3次) 600000人 共瀏覽1800000次
B級網友(10-100次 平均30次) 60000人 共瀏覽1800000次
C級網友(100-1000次 平均300次) 6000人 共瀏覽1800000次
D級網友(>1000次 平均1500次) 600人 共瀏覽 900000次

        從A級到D級的人數,以十分之一的比率減少(冪次定律不一定就是非十分之一不可,但在此配合總瀏覽次數推算出此比例)。
        要注意的是,因為是冪次定律,所以1-10次的平均應該比較接近3次(幾何平均) ,而不是5次(算術平均) 。另外1000次以上的部分,如果是1000-10000次,則其平均應是3000次,但總大部落格成立不過一年左右,如要瀏覽1000次,則每天要上來3次,這很合理,但如要瀏覽10000次,則每天要上來30次,似乎不太容易,所以目前應該很少人到達總次數10000次。所以我打個對折,把這一級的平均只算1500次。這樣加總起來,總瀏覽次數和實際的六百多萬次就很接近了。所以如果總人數六十多萬人的假設是對的,那麼上面的分布應該很接近事實。

       為了以下的討論,再把BC兩級細分一下:
B1級 10-30次 45000人
B2級 30-100次 15000人
C1級 100-300次 4500人
C2級 300-1000次 1500人

       注意,因為ABCD四級的人口比例是10倍的話,則其下一級也就是B1、B2、C1、C2的比例就是10的開根號,約3點多倍,簡單以3倍來算。(也就是上面所說的1和10的幾何平均,即是三點多)(注意不只B1:B2約是三,B2:C1也是)。

        由這個分布,我們來看看會買書跟會去投票的行為和瀏覽次數的關係。我覺得這不是支持不支持或回饋不回饋的問題,而應該用每一種事件在各級網友中的滲透率來看,比較有意思,也比較容易從正面去掌握現實狀況。總大上一本書”投資筆記”賣了六千本以上(尚有需求卻絕版無法所有人都買到書,所以總數應大於六千)。對照上表,C+D級網友的總數恰是六千多人。而總大出那本書的時候,部落格的規模應該還比現在小一點(總按:小很多,因為當時我尚未在媒體大量曝光),這兩級的網友還比上列的少一點,所以我們可以推測買書的行為,除了CD兩級外,還部分滲透到B級網友中去(當然也有人買不只一本,但這部分應不會佔太大比例)。

        假設總大現在出新書,相信瀏覽100次以上的網友,都算是十分認同總大,極可能每人都會買一本,所以會有基本銷售額6600本。如果瀏覽30次以上的人購買的比例是x%,則銷售量可達6600+15000*x%。例如x%=30%,則會有約11000本的總銷售量(保守一點,假設瀏覽30次以下的算是過客,不會買書)。

        至於投票又是怎麼回事呢?上一本書銷售了六千本,所以願意買書支持總大的人,不可能只有一千多人。只是滑鼠按一下而已,又沒有要叫你交訂金,一點損失也沒有,為什麼不願意呢?不想買書的人,也許真的不太會想去投那一票,但是想買書的人,如果知道有這個投票,一定都不會拒絕去投一票的吧。所以我們可以合理懷疑,這不是支不支持總大的問題,而是投票的可及性的問題。也就是投票系統的設計,使得你必須是非常重度的使用者才會去注意到它(門檻比買書本身還要高)。

        從上面的人口分布看來,D+C2差不多兩千人。可見必須瀏覽300次以上的網友才有機會注意到正在進行投票。其實這也是可以理解的。無名小站的投票欄,擺在不起眼的角落,字體又小,所以一定要有其他資訊線索的指引,才會注意到有在進行新的投票。一般上站次數比較少一點的網友,光是看主要的文章就來不及了,如何還有機會注意到這些。總大投票的訊息,在哪些地方可以發現呢?可能置頂公告或幾篇事務性的文章裡有提到幾句吧。然後就是某些文章的回應裏,有網友催票的文章。其他並沒有明顯的訊息。由此可見瀏覽次數不夠多的鄉民,是比較不會注意到事務性的文章以及網友回應的文字的。而要上站很多次的重度使用者,才會連各種回應都一篇一篇給它看下去。這牽涉到網路動線和使用者行為的課題,其實是滿有意思的,相信也是搞行銷的人很感興趣的吧。(別說一切的訊息是如此明顯,這些人為何都沒有注意。應該不少人有在陌生的城市誤闖單行道或迷路的經驗吧!明明地上畫了大大的箭頭,路口樹立著大大的指標,就是會走錯或找不到路。每個人看東西的習慣是不一樣的,世界上沒有什麼東西是理所當然很明顯的。)

       哈哈!我如果是總大,就會設計一些實驗來更進一步了解部落格使用者的行為。譬如把某次新投票的訊息藏在某個不起眼的角落,並要求看到的人安靜去投票就好,不要宣揚。那麼由投票的人數,配合上面的人口結構,就可以了解大概要上站幾次的人,才能夠看到那個角落。又或者把新投票的訊息置入在不同的主要理財文章裡面,這樣應該會有很多人看到吧,可以把這個當作一種流量探測器,看幾種不同的文章的人氣分布是如何。總而言之,像這一次的投票結果,都是極寶貴的資料,從中可以了解網路上瀏覽者的行為模式,提供經營部落格甚至網路行銷的重要參考資訊。若單純把他看作是網友支持度的指標,而忽略過去,甚至產生負面的失望挫折情緒反應,那就太可惜了。

        除了瀏覽次數以外,像搶頭香的行為,也很可能形成冪次定律分布的,因為搶到越多次頭香的人,會越搶越上癮,經驗也越豐富,也更容易搶到更多次頭香。所以這個系統似乎稍微可以符合大者越大的性質。不過搶頭香的隨機性好像差一點,所以也不一定能成立。不過這是不難驗證的,只要有人閒著沒事,把本站約一千篇文章的頭香網友列出來,統計出每個人獲得頭香的次數,看看其分布情形即可了解。這種”總幹事網站頭香次數分布之研究”,如果在三十年前做出來,可以使你成為這們學問的先驅哩(三十年前恐怕還沒有部落格或網路這種東西吧,所以也無從研究起)。如果十五前做,也還可能當做研究所的論文,使你獲得學位呢。如今冪次定律的學問已經大為昌盛,就只能拿來當茶餘飯後的消遣了。(總按:這不用統計,BLUE與eva就是前兩名)

        最後再看看A級(甚至B級)的網友。這些人大概就是那些不買書、從來不回應、也不可能去投票的人吧。可是看一下上面的人口結構分布,可以發現ABCD四級的網友總瀏覽次數是一樣的。尤其如果我上面沒有把D級的平均向下修正的話,那簡直就是每級的瀏覽次數各佔四分之一。換句話說,這AB兩級的路人甲鄉民,佔了總瀏覽數的一半之多。一個部落格最大的本錢之一,不就是這個總瀏覽次數嗎?這些人貢獻了其中的一半,就好像一個公司,某個營業項目貢獻了總營收的一半,雖然他們不買書不回應不投票,能說他們沒有貢獻嗎?而這些人不過上站幾次或一二十次,在結構這麼繁複的部落格裏,能期望他們多麼快的進入狀況呢?大部分的人可能還沒發現這個部落格的好處,就不再上來了吧!更遑論參與什麼互動。如何在這樣少數幾次的接觸裡面,就和這些人擦出火花,其實也是一個有趣的課題呢。說到這些鄉民,便要帶入本文最後的一個主題,也就是冪次定律分布的另一個重要啟示:長尾理論

               三、長尾(long tail)理論

        長尾理論或長尾市場,其實以上面的總大部落格人口結構就可以簡單說明。

        在一個依照冪次定律分布的系統裡面,一些極大規模的事件,並不是那麼異常而罕見,完全可以隨機而產生,這是我們第一段談論的主題。而長尾理論則著重在另一個方向,即在這樣的系統裏,極小規模的事件,其總量亦為不可忽視。若是傳統常見的常態分布,大家都知道與平均值相差兩個或三個標準差以上的事件就極為稀少。所以常態分布畫成一個分布圖,會是鐘型曲線,其尾巴很短小,所以可以稱為短尾曲線。相對的冪次定律的分布曲線,其尾巴就長的多。例如總大部落格的總瀏覽次數,如上面所分析,AB兩級的路人甲鄉民就貢獻了一半。

        又或者財富雖然大量集中,但是散戶的總資產還是佔了相當的比例。又如城市人口雖然大量集中,但鄉村總人口還是佔了可觀的比例。(如果都市化造成環境破壞以致鄉村再也不存在時,那也就不適用這個理論了,因為那時由於人為的影響,已不是呈現自然形成的冪次定律分布了) 。這個理論應用在市場上就是說,在某一種行業裡面,雖然市佔率前幾大者,會大者恆大,但是只要這個市場的分布是冪次定律,那麼把前幾大扣掉之後,那些雜牌的總市佔率,還是很可觀的,而這一部分也就是可以切入開發的潛力市場。或者也可以從另一個角度看,只要能把這些小咖都統合起來,其實力是足以與市場老大相抗衡的。又例如總大部落格,如果能設法使平均只上來三次的A級網友,在這三次上站之中便決定購買總大的書,因為A級網友佔很大的數量(長尾) ,即使只有1%能夠達到,也能使書籍的銷售量立刻增加6000本,是很可觀的成長。能夠創造大幅度成長的,往往是路人,而不是常客。

        要注意,這個長尾理論最重要的前提是,必須在冪次定律分布的系統或市場中才有效。相信很多理財投資書籍或文章,炒熱門趕流行,可能都不會太強調這一點。上面有提過,冪次定律的形成必須有兩個條件,一個是規模大小的變化是隨機的,另一個是規模越大則變為更大的機會就越大。如果只符合第二個條件而不符合第一個,也就是說,某些超大規模的怪獸已經有能力破壞隨機性,而可以完全消滅小規模的個體,使其不能形成自然的分布時,就變成了寡占或獨占市場,而不是長尾市場了。(我個人覺得,像電腦作業系統這種有相容性問題的市場,就很容易變成這種不符合長尾市場的情形。如果這個想法是對的,那麼也許全球語言使用者的人口分布也應歸屬於此類,因為語言也有相容性的問題。所以可以推測,少數語言必會大量消滅,其總使用人口並無法長期維持一個顯著的長尾比例。)有關長尾理論,最近資料也很多,只是凡是投資理財書籍或報導,談論這一類熱門題材的,有的都灌很多水,十頁可以講完的東西,也可以寫兩三百頁,不然就是過度擴張延伸,前提條件都沒有界定清楚。所以這些書籍我就沒有去閱讀(我還是比較欣賞科普書籍的呈現方式) ,有興趣的網友可以自行去研究。

         後記:我並非此方面的專家,只是讀了書有些心得,又有感而發,如有錯漏之處,請各位網友多多指教!

        右下有投票
arrow
arrow
    全站熱搜

    bonddealer 發表在 痞客邦 留言(0) 人氣()