SAS - 数据集

可供 SAS 程序进行分析的数据称为 SAS 数据集。 它是使用 DATA 步骤创建的。SAS 可以读取各种文件作为其数据源,例如 CSV、Excel、Access、SPSS 以及原始数据。 它还具有许多可供使用的内置数据源。

  • 如果数据集被 SAS 程序使用并在会话运行后被丢弃,则数据集称为 临时数据集

  • 但如果它被永久存储以备将来使用,则它被称为永久数据集。 所有永久数据集都存储在特定库下。

SAS 数据集以行和列的形式存储,也称为 SAS 数据表。下面我们看到了内置的永久数据集以及来自外部来源的红色的示例。


SAS 内置数据集

这些数据集已在安装的 SAS 软件中可用。 它们可以被探索并用于为数据分析制定样本表达式。 要探索这些数据集,请转到 Libraries -> My Libraries -> SASHELP。 在展开它时,我们会看到所有可用的内置数据集的名称列表。

data_sets_1_explore

让我们向下滚动以找到名为 CARS 的数据集。双击此数据集将在右侧窗格中打开它,我们可以进一步探索它。我们还可以使用最大化视图最小化左侧窗格 右窗格下的按钮。

data_sets_2_CARS

我们可以使用底部的滚动条向右滚动以浏览表中的所有列及其值。

data_sets_3_CARS_explore

导入外部数据集

我们可以使用 SAS Studio 中提供的导入功能将我们自己的文件导出为数据集。 但这些文件必须在 SAS 服务器文件夹中可用。 因此,我们必须使用 Server Files and Folders 下的上传选项将源数据文件上传到 SAS 文件夹。

data_sets_4_1_loacl_files_to_server

接下来,我们通过导入在 SAS 程序中使用上述文件。 为此,我们使用选项 Tasks -> Utilities -> Import data ,如下所示。 双击导入数据按钮,打开右侧的窗口以选择数据集的文件。

下一步单击右窗格中导入数据程序下的Select Files按钮。 以下是可以导入的文件类型列表。

data_sets_5_import_files

我们选择存储在本地系统中的"employee.txt"文件,得到如下图所示的导入文件。

data_sets_4_2_import_utility

查看导入的数据

我们可以通过运行使用 Run 选项生成的默认导入代码来查看导入的数据

data_sets_6_view_imported_data

我们可以使用与上述相同的方法导入任何其他文件类型,并在各种 SAS 程序中使用它。