可視化簡史

本文將介紹數據圖形可視化中的一些主要創新者及其一些著名的作品。可視化發展與測量、繪畫、文明、科技的發展是一脈相承的。
本文是多篇資料及網上資源的整合,出處放置文尾。在本文中,將介紹數據圖形可視化中的一些主要創新者及其一些著名的作品。可視化發展與測量、繪畫、文明、科技的發展是一脈相承的。在地圖、科學、工程製圖、統計圖表中,可視化技術已發展了數百年。

在計算機學科的分類中,利用人眼的感知能力對數據進行交互的可視圖表以增強認知的技術,稱為可視化。

可視化將不可見或難以直接顯示的數據轉換為可感知的圖形、符號、顏色、紋理等,以增強數據識別效率,傳遞有效信息。可視化通常被理解為生成圖形圖像的過程。更深刻的說法是,是數據認知的過程,數據形成感知圖像,強化認知理解的過程,而非繪製的可是圖形本身。因此,可視化可理解為通過可視表達增強人們處理數據效率

本文目錄:

  • 17世紀以前:萌芽

  • 17世紀:測量與理論

  • 18世紀:圖形符號

  • 1800-1849:現代數據圖形的開端

  • 1850-1899:數據圖形的黃金時代

  • 1900-1949:現代啟蒙

  • 1950-1974年:數據可視化的重生

  • 1975年1987年:多維數據可視化

  • 1787年-2004年:交互可視化

  • 2004年至今:可視分析學

17世紀以前:萌芽

我們永遠都無法知道世界上第一個數據可視化的作品長的是什麼樣子了,它早就在滄海桑田中不知所踪。地圖最初用於導航,土地,好奇心,已經以某種形式存在了至少一萬年。

其中最早的地圖在公元前6200年於土耳其地區出現。

中國的地圖最早見於夏朝,《史記·夏本紀》記載了夏禹治水的事蹟,地圖繪製在鼎上,九鼎是見於文獻記載的、刻繪有九州山川形勢的原始實物地圖。現代考古發現的我國最早的地圖實物,是出土於甘肅天水放馬灘戰國墓地一號墓中的《放馬灘地圖》。

公元前1150年埃及都靈紙莎草地圖,在公元前14世紀中葉的古埃及新王國時期,尼羅河中游,曾經雄踞著一座當時世界上無與倫比的都城,這就是被古希臘大詩人荷馬稱為“百門之都”的底比斯。而下圖草圖,是在19世紀的“底比斯”中發現。它是現存最古老的地形圖,展示了一系列令人著迷的信息,包括地理和礦物開採數據。

公元前366-335年,第一張城市路線圖顯示了整個羅馬世界,這是從維也納到意大利,再到迦太基的地圖信息,被塗在羊皮紙上。 (以16世紀德國收藏家的名字命名為Peutinger)

公元150年,克勞迪烏斯·托勒密繪製的球形地球地圖,是第一張通過天體觀測來製定陸地位置的地圖,同時第一次採用了經緯線。托勒密詳細揭示瞭如何採用兩種方法將球體的地球繪製到平面上,探討了地圖投影和比例尺的問題,明確了地圖應該“上北下南”,並且以扇形的方式將球形地圖展開,直到今天,這些理論仍然是地形圖和世界地圖繪製的標杆。

950年,歐洲《行星運動圖》是已知的最早嘗試以圖形方式顯示變化的值(全年中太陽,月亮和行星的位置)。

1092年,蘇頌渾象西南方中外官星圖。

1569年8月,墨卡托出版了他的世界地圖,這是真正意義上的第一張世界地圖,它開創了地理學史上的新篇章。

墨卡托發明圓柱投影用於在地圖上描繪地球,以保持橫線的直線性,地圖上的直線在看著指南針時可以轉換為恆定方位線,因此非常適合海上航行。它被證明很受歡迎,並且仍是我們今天最常見的世界地圖投影。

墨卡托投影的地圖最大的缺點就是和現實差別太大,變形非常嚴重。在墨卡托投影的地圖上,變形最嚴重的就是非洲和格陵蘭島了。地圖上非洲的大小和格陵蘭島差不多大,但如果計算一下的話:非洲面積約是3020萬平方千米,格陵蘭島面積約是217萬平方千米,而3020÷217≈14。也就是說,非洲的面積是格陵蘭島的14倍!

在16世紀,用於精確觀測和測量物理量的技術和儀器得到了很好的發展。同樣,人們有了直接捕獲圖像並將數學函數記錄在表格中的初步想法。這些早期步驟是可視化圖表萌芽的開始。

17世紀:測量與理論

17世紀理論上有了巨大的新發展:解析幾何的興起,測量誤差的理論和概率論的誕生,以及人口統計學的開端和政治版圖的發展。到本世紀末,數據可視化方法必不可少的要素已經具備了,一些具有重大意義的真實數據,有意義的理論及視覺表現方法出現,人類開始了可視化思考的新模式,可以將本世紀視為可視化的開端。

1626年克里斯托弗·施納(Christopher Scheiner)繪製出來表達太陽黑子隨時間變化的圖,在一個視圖上同時展示多個小圖序列,是郵票圖表法的雛形。

1637年, Pierre de Fermat 和笛卡爾在數學,解析幾何中重新引入坐標系,建立點線與方程之間的一一對應關係。

1644年邁克爾·範·蘭格倫(Michael van Langren)描述了從托萊多到羅馬的12種經度確定:很可能是統計數據的第一個視覺表示。這幅圖現在被認為是第一幅(已知的)統計圖形。這幅圖以一維線圖的形式繪製了在托萊多到羅馬之間12個當時已知的經度差異。在經度上標註了觀測的天文學家的名字,有效的安排了數據的表達方式,堪稱里程碑之作。

1654年布萊斯·帕斯卡對概率論做出了初步陳述。那是一個非常具有歷史性的成果。

1662年John Graunt 建立人口統計學:統計數據概念的重要發展。圖為倫敦洗禮和葬禮的記錄,倫敦的平均預期壽命為27歲,其中16%的人到16歲時死亡。

1666年加拿大進行了第一次現代完整的人口普查,記錄了新法蘭西3215名居民。申報表相當完整,提供了有關人口,性別,家庭,婚姻狀況,年齡,職業和行業的數據,共填寫154頁。

1686年,哈雷Edmond Halley 繪製了第一幅已知的氣象圖,顯示在地理地圖上主流風場分佈。這也是向量場可視化的鼻祖。

1693年哈雷Edmond Halley 首次使用矩形區域來表達獨立的二進制事件概率。

18世紀:圖形符號

社會和科技進步相伴隨的是數據的價值開始為人們所重視,人們不滿足只在地圖上展示幾何圖形,抽像圖形和函數圖形的功能被大大擴展,許多嶄新的數據可視化形式在這個世紀裡誕生了。

1701年,哈雷(Halley)繪製《大西洋電磁圖》。上面在坐標網格上用等值線表示了等值的磁偏角,這是第一個使用等值線(或等高線)的圖表,它們是等值線等50多種命名類型的鼻祖。

1752年Leonhard Euler 引入一種符號,該符號為3D空間(x,y,z)中的每個可能點提供名稱和地址。

1758年,約翰內斯·托比亞斯·梅耶(Johanes Tobias Mayer)開發圖表以代表色彩系統,一種構造和命名許多顏色的系統。蘭伯特用"飽和度''的3D金字塔顏色系統擴展了此範圍。

1765年,約瑟夫·普里斯特利(Joseph Priestley)發明了時間線圖《傳記圖》,顯示了各種古典政治家和哲學家的一生。 Priestley不僅在時間軸上列出了姓名,出生年和死亡年,而且還列出了出生年和死亡年,從而可以看出歷史人物所處時代。時間表證明是成功的,並直接啟發了Playfair發明條形圖,該條形圖首次出現在他的“商業和政治地圖集”中。

1769年約瑟夫·普里斯特利(Joseph Priestley)發行了通常被認為是18世紀最具影響力的時間表《新圖》,顯示帝國的興衰。水平線傳達了成名,影響力,權力和統治力的持續時間的概念。垂直閱讀傳達了思想,事件和人的同時性印象,空隙表示例如知識分子的黑暗時代。這一幅作品直接激發了柱狀圖的誕生。

1782年Marcellin Du Carla繪製的第一幅地形圖,用一條曲線表示相同的高度,對於測繪,工程和軍事有著重大的意義,成為了地圖的標準形式之一。

18世紀是統計圖形學繁榮時期,其奠基人William Playfair 發明了折線圖、柱狀圖、餅狀圖、圓圖。他的經歷非常曲折。他依次是一位麥賴特人,工程師,製圖員,會計師,發明家,銀匠,商人,投資經紀人,經濟學家,統計學家,小冊子作者,翻譯,公關人員,土地投機者,定罪者,銀行家,熱情的保皇黨人,編輯,敲詐者和新聞記者。他設計的圖表構成了當今數據可視化的核心要素。

下圖顯示了蘇格蘭與歐洲和世界各個地區的貿易平衡。他通過以這種方式顯示數據,很容易發現蘇格蘭與愛爾蘭的緊密經濟聯繫以及與俄羅斯的貿易不平衡。

下圖為丹麥與挪威1700-1780年間的貿易出口序列圖。

1786年Playfair 發明條形圖,顯示小麥與工資的價格。

1800-1849:現代數據圖形的開端

隨著工藝設計的完善,統計圖形和主題製圖爆炸性增長,包括柱狀圖,餅圖,直方圖,折線圖,時間線,輪廓線等。在專題製圖學中,製圖從單一地圖發展為全面的地圖集,描繪了涉及各種主題(經濟,社會,道德,醫學,身體等)的數據,同時演化出了可視化思考的新方式。

1801年William Playfair 的餅圖和圓形圖,用於顯示整體關係。不過他早在1789年就使用餅圖顯示土耳其各地區疆土比例。

1811年亞歷山大·馮·洪堡使用細分條形圖的圖表s和重疊的正方形,顯示了墨西哥領土和殖民地人口的相對大小。

1817年亞歷山大·馮·洪堡繪製的第一張等溫線圖,通過緯度顯示世界各地的平均溫度和經度。下圖顯示溫度與這兩個變量之間的直接關係,這讓人們認識到溫度受於緯度和海拔影響。

在1801年,英國地質學家William Smith繪製了第一幅地質圖,這張描繪了英格蘭地層信息。於1815年出版後引起轟動,引領了一場在地圖上表現量化信息的潮流。

1826年,查爾斯·杜品(Charles Dupin)《法國總人口圖鑑》 發明了連續使用黑白底紋(黑白程度)來顯示法國識字分佈情況的方法,這是第一張現代形式的主題統計地圖。

1829年安德烈·米歇爾·古里繪製極區圖(早於佛羅倫薩·南丁格爾),顯示了周期性現象發生的頻率。

1830年, Frère de Montizon繪製了法國人口的點密度地圖,這是第一張點圖。

1843年LéonLalanne 在圖表使用極坐標的中表達風向的頻率。

1844年,Minard繪製了一幅名為“Tableau Graphique”的圖形,顯示了運輸貨物和人員的不同成本。在這幅圖中,他創新的使用了分塊的條形圖,條形塊圖的寬度對應路程,高度對應旅客或貨物種類的比例。這幅圖是當時馬賽克圖(mosaic plot)的先驅。

1845年,一位法國土木工程師查爾斯·約瑟夫·米納德,他在結合統計和製圖領域。他繪製了人類歷史上第一幅流圖,顯示了通過該地區道路收集的交通數據。用可變寬度的線段顯示了交通運輸的軌蹟的乘客數量。

1850-1899:數據圖形的黃金時代

到1800年代中期,可視化快速發展的所有條件已經建立。認識到數字信息對社會計劃,工業化,商業和運輸的重要性日益提高,歐洲各地開始建立了官方的國家統計局。由高斯和拉普拉斯發起的統計理論,再由蓋瑞和克特萊特擴展到社會領域,提供了理解大量數據的手段。

1854年約翰·斯諾(John Snow) 倫敦爆發的霍亂病例群 :使用點圖映射了1854年的寬街霍亂疫情,他還使用統計數據來說明水源質量與霍亂病例之間的聯繫,這表明該疾病是通過受污染的水傳播的,而不是以前認為的空氣傳播的斯諾的研究是公共衛生和地理歷史上的重大事件。它被認為是流行病學的創始事件。

弗羅倫斯·南丁格爾作為現代護理界受人尊敬的創始人,也是一位才華橫溢的數學家,他是統計學圖形表示的先驅。弗羅倫斯·南丁格爾主動申請,自願擔任戰地護士。她率領38名護士抵達前線,在戰地醫院服務。她竭盡全力排除各種困難,僅僅半年左右的時間傷病員的死亡率就下降到2.2%,戰爭結束後,南丁格爾回到英國,被人們推崇為民族英雄。

1857年,她以Playfair的思想為基礎,將圖表併入她的許多出版物中,繪製了極地面積圖Coxcomb。下圖為東方軍隊中死亡原因圖,該圖表按月描繪了克里米亞戰爭期間關於士兵死傷原因,每個楔形物的面積代表了統計數據的大小。

1861年弗朗西斯·加爾頓(Francis Galton)繪製現代天氣圖,圖表在地圖上通過字形顯示相似的氣壓和氣壓變化。這些導致發現了低壓周圍風的反氣旋運動。

1869年門捷列夫Dmitri Mendeleev 元素週期表用於根據化學元素的性質對化學元素進行分類,並可以預測以後會發現的新元素。由於週期表能夠準確地預測各種元素的特性及其之間的關係,因此它在化學及其他科學範疇中被廣泛使用,作為分析化學行為有用的框架。

1869年查爾斯·約瑟夫·米納德發布的1812年拿破崙東征俄羅斯事件的流圖,被譽為有史以來最好的數據可視化。他的流圖呈現了拿破崙軍隊的位置和行軍方向、軍隊匯集、分散和重聚的時間地點、減員等信息。

這種“流圖”在後世命名為桑吉圖(Sankey diagram),桑吉圖以愛爾蘭工程師Matthew HR Sankey 的名字命名,桑基完成了箭頭上與能量成比例的能量的首次圖示,比較了蒸汽機的能量效率(能量平衡)。

維多利亞時代的統計學家弗朗西斯·高爾頓(Francis Galton)建立了相關性的統計概念,並廣泛促進了回歸均值。 1886年,在分析兩個變量之間的關係時,高爾頓設計了一種圖形技術,為比較成年子女的身高與父母的平均身高,其中將每種組合的頻率繪製在網格上,在此網格上,輪廓線被覆蓋,顯示了數據的密度。對於兩個相關的,正態分佈的變量,這些輪廓應形成一個橢圓,長軸充當線性回歸的形式。

1879年Luigi Perozzo 繪製立體圖(三維人口金字塔)以實際數據為依據(瑞典人口普查,1750-1875年)。此圖與之前的可視化形式有一個明顯的區別:開始使用三維的形式,並使用彩色表示了數據值之間的區別,提高了視覺感知。

1884年穆爾霍爾Michael George Mulhall 繪製象形圖,用於通過與數字成正比的圖形表示數據。

1885年法國工程師Ibry 繪製的火車時刻表圖形,顯示從巴黎到里昂的路線上的行駛速度。此法沿用至今。

1900-1949:現代啟蒙

如果1800年代初是統計圖形和專題製圖的“黃金時代”,則1900年代初可以稱為可視化的“現代黑暗時代” 。少有圖形創新,到1930年代中期,社會科學中量化和正式的,通常是統計的模型的興起,取代了以1800年代後期的可視化熱情特徵。

1904年Manuder 繪製蝴蝶圖,研究黑子的時間變化,驗證了太陽黑子的周期性。

1911年Hertzsprung-Russell 圖,作為溫度函數的恆星亮度的對數圖,解釋了恆星的演化,成為現代天體物理的奠基之一。

1917年亨利·勞倫斯·甘特繪製甘特圖,旨在顯示項目的計劃進度和實際進度。甘特圖最初用於大型建築項目,下圖為現代甘特圖。

1933年繪製的倫敦地鐵圖,出版後迅速為乘客接受,並成為今日交通線路圖形的一種主流表現形式。

1950-1974年:數據可視化的重生

引領這次大潮的,首先是一個劃時代的事件——現代電子計算機的誕生。計算機的出現徹底地改變了數據分析工作。到60年代晚期,大型計算機已廣泛分佈於西方的大學和研究機構,使用計算機程序繪製數據可視化圖形逐漸取代手繪的圖形。計算機對數據可視化的影響:高分辨率的圖形和交互式的圖形分析,提供了手繪時代無法實現的表現能力。

另一件喚醒可視化的歷史事件是統計應用的發展,數理統計把數據可視化變成了科學,世界大戰和隨後的工業和科學發展導致的對數據處理的迫切需求把這門科學運用到各行各業。在應用當中,圖形表達佔據了重要的地位,比起參數估計假設檢驗來,明快直觀的圖形形式不是更容易被人接受嘛。

1957年埃德加·安德森使用圓形字形,用射線表示多元數據。

1958年Alban William Housego Phillips 發明散點圖"菲利普斯曲線" ,通貨膨脹與失業之間的關係顯示出強烈的反比關係,促進宏觀經濟理論的發展。

1960年代中期地理信息系統GIS的初步開發,結合了空間參考數據,空間模型和基於地圖的可視化。示例:哈佛大學計算機圖形學(和空間分析)實驗室開發SYMAP,在行式打印機上生成等值線圖,線形圖和近端圖。

1967年,Jacques Bertin 出版了一部里程碑式的著作,Semiologie Graphique。這部書根據數據的聯繫和特徵,來組織圖形的視覺元素,為信息的可視化提供了一個堅實的理論基礎。圖為貝爾丁的七個視覺變量。

1969年John W. Tukey 探索性進行了數據分析圖形的創新,發明箱型圖。

1971年不規則多邊形"星圖"代表多元數據(頂點等距間隔開,到中心的距離與變量的值成正比)。下圖為美國城市犯罪率星圖。

1971年Ruben Gabriel 繪製出雙標圖,這是發展一種在單個顯示器中可視化多變量數據集中的觀測值和變量的方法。觀測值通常由點表示,變量由向量表示,使得點沿向量的位置代表數據值。下圖為血液數據的雙標圖。

1973年神奇的卡通臉譜圖Chernoff faces。用臉譜來分析多維度數據,即將P個維度的數據用人臉部位的形狀或大小來表徵。

臉譜圖分析法的基本思想是由15-18個指標決定臉部特徵,若實際資料變量更多將被忽略,若實際資料變量較少則臉部有些特徵將被自動固定。統計學曾給出了幾種不同的臉譜圖的畫法,而對於同一種臉譜圖的畫法,將變量次序重新排列,得到的臉譜的形狀也不同。

1974年,美國人口統計局胃癌發生率,在地圖上用不同顏色表示所在區域的變量值。

1975年1987年:多維數據可視化

各種計算機系統,計算機圖形學,圖形顯示設備,人機交互技術發展激發了人們可視化熱情。數據密集型計算器走上了舞台,也造就了對數據分析和呈現的更高需求。

1975年William S. Cleveland 和Beat Kleiner 製作的散點圖增強型, 帶有三條移動統計的均線。下圖為美國1970年彩票數據草稿。

1975年John Hartigan 的散點圖矩陣,在表格顯示中繪製n個變量的所有成對散點圖的想法。

1981年George W. Furnas 製作的魚眼視圖:一種新的想法,可以在大量信息感興趣的區域中提供焦點和更多細節,同時以較少的細節保留周圍環境。下圖為華盛頓特區中部的魚眼圖。

1981年John Hartigan 等發明的馬賽克圖,以表達多維類別行數據。下圖為Hartigan和Kleiner5路馬賽克電視收視率。

1981年,Xerox 8100 Star引入了第一個商業圖形用戶界面(GUI),並帶有諸如電子表格之類的應用程序,它們能夠從信息表中自動生成圖形。只需單擊幾下鼠標,就可以完成曾經費時數小時的仔細刻蝕或繪製工作,並且可以更加輕鬆地進行編輯,格式化和更新。從那裡開始,各種各樣的製圖技術和样式激增,無數軟件包提供了一系列顯示數據的方法。

1982年喬治·羅里克(George Rorick)繪製彩色天氣圖開創了報紙上的彩色信息圖形時代。不久,色彩斑visual 的視覺圖形開始普及。

1985年Alfred Inselberg 發明的高維數據的平行坐標圖。

1787年-2004年:交互可視化

交互式的可視化,它們必須具有與人類交互的方式,如單擊按鈕,移動滑塊,以及足夠快的響應時間以顯示輸入和輸出之間的真實關係。

1987年,美國國家科學基金會召開首次有關科學可視化的會議,會議報告正式命名並定義了科學可視化,認為可視化有助於統一計算機圖形學、圖像處理、計算機視覺、計算機輔助設計、信息處理和人機界面的相關問題。

1987年理查德·貝克爾和威廉·克利夫蘭用交互式統計圖形,連結等其他形式進行可視互動。

1988年Antony Unwin 和格雷厄姆·威爾斯製作出可直接操作(縮放,縮放,覆蓋等)的多個時間序列式交互圖形。

20世紀80年代末,視窗系統的出現使得人們能夠直接與信息進行交互。

1989年哈斯萊特,安東尼·溫溫和克雷格製作交互動作鏈接到地圖顯示的統計圖形Graham Wills。

1989年Ted Mihalisin 使用``嵌套尺寸''(與網格和馬賽克顯示有關)來可視化多維數據。對連續變量進行分箱,然後以嵌套方式將變量分配給水平和垂直尺寸。下圖為四個響應變量與年齡、性別、教育程度間的關係。

1991年Michael Friendly鑲嵌顯示開發為對數線性模型的可視化分析工具。

1991年Ben Shneiderman發明樹狀圖,用級聯嵌套的平面化樹狀結構表達層次結構可視化。

1991-1996年一系列用於數據分析和可視化的高度交互式系統的開發和公共發行,例如XGobi。

1994年施樂公司桌面表格:用於查看大表的焦點和上下文技術;用戶可以擴展行或列以查看詳細信息,同時保留周圍的上下文。

1996年Jason Dykes 發明製圖數據可視化工具:一種地圖可視化工具包,具有用於查看數據的圖形工具,包括用於探索性空間數據分析的多種映射選項。

2002年吉姆(Jim Flanagan) 發明標籤雲(也稱為“詞云”)在視覺上刺激了大型文本的摘要。他們的目的是選擇文本並直觀地顯示該文檔中最常用的單詞的出現頻率。通過突出顯示感興趣的特定作品中的主要主題,這些對於定性分析很有用。

2004年至今:可視分析學

進入21世紀,隨著計算機相關硬件升級,現有可視化已難以應對海量、高維、多源的動態數據的分析挑戰,需要綜合可視化、圖形學、數據挖掘理論與方法,研究新的理論模型,輔助用戶從大尺度、複雜、矛盾的數據中快速挖掘出有用的數據,做出有效決策,這門新興學科稱為可視分析學。

數據分析的任務通常是定位、識別、區分、分類、聚類、分佈、排列、比較、內外連接比較、關聯、關係等。可視化分析降低了數據理解的難度,突破了常規統計分析的局限性。如下,交通擁擠圖:

值得注意的是,可視化分析的基礎理論與方法,仍在形成、探索。等過個10年有機會再補全此段內容。

參考:

數據可視化簡史https://towardsdatascience.com/a-short-history-of-data-visualisation-de2f81ed0b23

《數據可視化》 https://book.douban.com/subject/25760272/

第一張電磁圖: https://academic.oup.com/astrogeo/article/42/1/1.23/270989

數據可視化經歷了怎樣的發展歷程? https://www.zhihu.com/question/23077930

可視化簡史http://datavis.ca/papers/CHF-2x2.pdf

數據可視化簡明史https://www.douban.com/note/253394412/

統計圖形和數據可視化http://euclid.psych.yorku.ca/SCS/Gallery/milestone/sec9.html

來源:可視化簡史


數位轉型服務諮詢
Total
0
Shares
Previous Article

次年規劃如何寫?

Next Article

電商設計思維——詳情頁中的"IDCMA"邏輯法則

Related Posts