五月天激情婷婷婷久久,亚洲国产第一区二区香蕉,亚洲欧美综合网站

趙衛(wèi)東:數(shù)據(jù)集概述

大數(shù)據(jù)數(shù)據(jù)集

2017-11-29 3541

Dataset是一個(gè)數(shù)據(jù)的集合，通常以表格形式出現(xiàn)。每一列代表一個(gè)特定變量。每一行都對(duì)應(yīng)于某一成員的數(shù)據(jù)集的問題。它列出的價(jià)值觀為每一個(gè)變量，如身高和體重的一個(gè)物體或價(jià)值的隨機(jī)數(shù)。每個(gè)數(shù)值被稱為數(shù)據(jù)資料。對(duì)應(yīng)于行數(shù)，該數(shù)據(jù)集的數(shù)據(jù)可能包括一個(gè)或多個(gè)成員。

從歷史上看，這個(gè)術(shù)語起源于大型機(jī)領(lǐng)域，在那里它有一個(gè)明確界定的意義，非常接近現(xiàn)代的計(jì)算機(jī)檔案。這個(gè)主題是不包括在這里。

最簡(jiǎn)單的情況下，只有一個(gè)變量，然后在數(shù)據(jù)集由一列列的數(shù)值組成，往往被描述為一個(gè)列表。盡管名稱，這樣一個(gè)單數(shù)據(jù)集不是一套通常的數(shù)學(xué)意義，因?yàn)槟骋粋€(gè)指定數(shù)值，可能會(huì)出現(xiàn)多次。通常的順序并不重要，然后這樣數(shù)值的集合可能被視為多重集，而不是（順序）列表。

值可能是數(shù)字，例如真正的數(shù)字或整數(shù)，例如代表一個(gè)人的身高多少厘米，但也可能是象征性的數(shù)據(jù)（即不包括數(shù)字），例如代表一個(gè)人的種族問題。更一般的說，價(jià)值可以是任何類型描述為某種程度的測(cè)量。對(duì)于每一個(gè)變量，通常所有的值都是同類。但是也可能是“遺漏值”，其中需要指出的某種方式。

在統(tǒng)計(jì)數(shù)據(jù)集通常來自實(shí)際觀測(cè)得到的抽樣統(tǒng)計(jì)人口，每一行對(duì)應(yīng)于觀測(cè)的一個(gè)組成部分，人口。數(shù)據(jù)集可能會(huì)進(jìn)一步產(chǎn)生算法為測(cè)試目的某些種類的軟件。一些現(xiàn)代統(tǒng)計(jì)分析軟件，如PSPP仍然存在的數(shù)據(jù)中的經(jīng)典數(shù)據(jù)集的方式。

數(shù)據(jù)集在斷開緩存中存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)集的結(jié)構(gòu)類似于關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)；它公開表、行和列的分層對(duì)象模型。另外，它包含為數(shù)據(jù)集定義的約束和關(guān)系。

上一篇數(shù)據(jù)集的類型概述

上一篇商務(wù)智能的發(fā)展趨勢(shì)

評(píng)論