我正在使用gcp bigquery通过Google函数存储新闻流并将其保存在bigquery中。
如何运行使用来自bigquery的数据的python脚本,最后将分数和大小的结果写回相关数据集?
我在google文档中找不到任何有关它的内容,只是如何进行情感分析,而没有找到如何从bigquery中获取数据并将结果返回到bigquery。
非常感谢您的支持。
您没有为我们提供足够的具体答案,所以让我为您提供尝试此方法的一般方法:
首先,让我们使用gcloud
CLI对一个任意句子进行情感分析:
gcloud --format json ml language analyze-entity-sentiment --content "It's time we just let this thing go - it was a prett
y good bad idea, wasn't it though? -- Bad Idea, Sara Bareilles" | jq -c . > sentiments.json
[请注意,我用jq
删除了输出JSON的格式,并将结果存储在一个文件中。
要将每个句子的可能包含多个JSON行的文件加载到BigQuery:
bq load --autodetect --source_format=NEWLINE_DELIMITED_JSON temp.sentiments sentiments.json
该问题要求“流式传输到BigQuery”,但是像这样显示批处理负载可能更有意义。
现在我们有了一个表格,其中包含BigQuery中的结果:
SELECT * FROM `fh-bigquery.temp.sentiments` LIMIT 1000
顺便说一句,我在句子中添加了Sara Bareilles
,以确保BigQuery首次创建表时具有自动检测的完整模式。