在R中编码:<> unicode to letter

问题描述 投票:0回答:1

使用RFacebook包从帖子中提取评论时遇到问题。

localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here

问题是输出的编码。例如:

橄榄油/ o +00 a 9 / m

请注意,输出不是“/”,而是<>

例如,这个词应该显示为

有人

有什么建议?

提前致谢!

r encoding character-encoding rfacebook
1个回答
3
投票

考虑改变你的locale。这对Rfacebook来说不是问题。我可以通过将区域设置设置为C来复制您描述的行为,例如

x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"

通过将字符集处理的区域设置切换为具有扩展字符集的区域设置,可以实现所需的输出,例如,

Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"

locale参数的值可能在您的系统上有所不同。有关设置区域设置的更多信息,请参阅https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html(或?locales)。

© www.soinside.com 2019 - 2024. All rights reserved.