我正在使用散景图显示数据框中名词的频率。数据由公司及其专利组成,我从中提取了名词。
当我使用(0,10)的y_range显示频率时,数据将完美显示。当我使用公司列表时,数据偏移y_range坐标的一半。
scatter = figure(plot_width=800, plot_height=200,
x_range = max_words,
y_range = companies,
tools = tools
)
相比
scatter = figure(plot_width=800, plot_height=200,
x_range = max_words,
y_range = (0,10),
tools = tools
)
有关如何解决此问题的任何建议?
如果您提供分类因素的列表,例如y_range=companies
,则data中的实际坐标值也需要是相同的(字符串)分类因子,而不是数字。
存在一个用于分类范围的基本合成坐标系,这就是为什么传递数字在任何意义上都“起作用”的原因。但这不是预期的用法,并且不能保证从类别因子到(内部)合成数字坐标的映射在任何时候都不会改变(即不应依赖)。
有关更多信息和许多示例,请参见用户指南的章节Handling Categorical Data。
或者,如果您确实想保留数字y坐标,则可以使用FuncTickFormatter将整数坐标转换为要显示的公司名称,以便“伪造”类别y轴。