散景图y_range坐标偏离一半坐标

问题描述 投票:0回答:1

我正在使用散景图显示数据框中名词的频率。数据由公司及其专利组成,我从中提取了名词。

当我使用(0,10)的y_range显示频率时,数据将完美显示。当我使用公司列表时,数据偏移y_range坐标的一半。

scatter = figure(plot_width=800, plot_height=200, 
             x_range =  max_words, 
             y_range = companies,                
             tools = tools
            )

enter image description here

相比

scatter = figure(plot_width=800, plot_height=200, 
             x_range =  max_words, 
             y_range = (0,10),                
             tools = tools
            )

enter image description here

有关如何解决此问题的任何建议?

python bokeh scatter-plot frequency tfidfvectorizer
1个回答
1
投票

如果您提供分类因素的列表,例如y_range=companies,则data中的实际坐标值也需要是相同的(字符串)分类因子,而不是数字。

存在一个用于分类范围的基本合成坐标系,这就是为什么传递数字在任何意义上都“起作用”的原因。但这不是预期的用法,并且不能保证从类别因子到(内部)合成数字坐标的映射在任何时候都不会改变(即不应依赖)。

有关更多信息和许多示例,请参见用户指南的章节Handling Categorical Data

或者,如果您确实想保留数字y坐标,则可以使用FuncTickFormatter将整数坐标转换为要显示的公司名称,以便“伪造”类别y轴。

© www.soinside.com 2019 - 2024. All rights reserved.