共计 2117 个字符,预计需要花费 6 分钟才能阅读完成。
R 语言学习笔记 11- 读取 csv-xlsx-txt-json-pdf-lua 格式文件
- 读取 csv
-
- 使用 base 的 read.csv 函数
- 使用 readr 包的 read_csv 函数
- 读取 xlsx
-
- 使用 xlsx 包的 read.xlsx 函数
- 使用 readxl 包的 read_excel 函数
- 读取 txt
-
- 使用 base 的文件读取函数 readLines
- 使用 readr 包的 read_lines 函数
- 读取 json
-
- 使用 jsonlite 包读取 JSON 文件
- 读取 pdf
-
- 使用 pdftools 包读取 pdf 文件
- 读取 lua
-
- 使用基本的文件读取函数 readLines
读取 csv
使用 base 的 read.csv 函数
read.csv 是 R 语言中用于读取 CSV 文件的基本函数,它会将 CSV 文件读取为一个数据框对象
假设有一个名为 data.csv 的 CSV 文件,内容如下:
id,name,age
1,John,25
2,Jane,30
3,Bob,28
读取:
data read.csv("data.csv")
print(data)
输出:
id name age
1 1 John 25
2 2 Jane 30
3 3 Bob 28
使用 readr 包的 read_csv 函数
readr 包提供了更为快速和灵活的 CSV 读取函数 read_csv 特别适合大型数据集的处理
library(readr)
data read_csv("data.csv")
print(data)
读取 xlsx
使用 xlsx 包的 read.xlsx 函数
xlsx 包提供了一种读取 Excel 文件的方法,适用于较旧版本的 Excel 文件(.xlsx 格式)
假设有一个名为 data.xlsx 的 Excel 文件,内容如下:
id | name |
---|---|
1 | zhangsan |
2 | lisi |
3 | wangwu |
读取:
library(xlsx)
data read.xlsx("data.xlsx", sheetIndex = 1)
print(data)
输出:
id name
1 1 zhangsan
2 2 lisi
3 3 wangwu
使用 readxl 包的 read_excel 函数
readxl 包提供了更为现代和高效的方法来读取 Excel 文件,支持更多的 Excel 特性 适合处理各种 Excel 文件格式和大型数据集
library(readxl)
data read_excel("data.xlsx")
print(data)
读取 txt
使用 base 的文件读取函数 readLines
readLines 函数是 R 语言中用于逐行读取文本文件内容的基本函数
假设有一个名为 data.txt 的文本文件,内容如下:
1 John 25
2 Jane 30
3 Bob 28
读取:
lines readLines("data.txt")
print(lines)
输出:
[1] "1 John 25" "2 Jane 30" "3 Bob 28"
使用 readr 包的 read_lines 函数
如果需要更为高效地读取文本文件,特别是处理大型文本文件时,可使用 readr 包中的 read_lines 函数
library(readr)
data read_lines("data.txt")
print(data)
读取 json
使用 jsonlite 包读取 JSON 文件
jsonlite 包提供了在 R 中读取和处理 JSON 数据的功能。可使用其中的函数 fromJSON
来将 JSON 文件读取为 R 中的数据结构,如列表或数据框
假设有一个名为 data.json 的 JSON 文件,内容如下:
[
{"id": 1, "name": "John", "age": 25},
{"id": 2, "name": "Jane", "age": 30},
{"id": 3, "name": "Bob", "age": 28}
]
读取:
library(jsonlite)
data fromJSON("data.json")
print(data)
输出:
id name age
1 1 John 25
2 2 Jane 30
3 3 Bob 28
读取 pdf
使用 pdftools 包读取 pdf 文件
pdftools 包支持读取 pdf 文件的内容并进行进一步处理,例如提取文本或分析页面结构
假设有一个名为 document.pdf 的 PDF 文件,内容为一些文本页面:
library(pdftools)
pdf_content pdf_text("document.pdf")
cat(pdf_content[[1]])
读取 lua
使用基本的文件读取函数 readLines
可使用 R 语言的 readLines 函数来逐行读取 Lua 脚本文件的内容
假设有一个名为 script.lua 的 Lua 脚本文件,内容如下:
function factorial(n)
if n 1 then
return 1
else
return n * factorial(n - 1)
end
end
print(factorial(5))
读取:
lines readLines("script.lua")
print(lines)
输出:
[1] "function factorial(n)"
[2] " if n
[3] "return 1"
[4] "else"
[5] "return n * factorial(n - 1)"
[6] "end"
[7] "end"
[8] ""
[9] "print(factorial(5))"
原文地址: R 语言学习笔记 11- 读取 csv-xlsx-txt-json-pdf-lua 格式文件