将以下colab python代码(参见下面的链接)部署到Google上的Dataproc中,并且只有当input_list是一个包含一个项的数组时,当input_list有两个项时,PySpark作业就会在下面的get_similarity方法中的"for r in result.collect()“中出现以下错误:
java.io.IOException: Premature EOF from inputStreamerror"
由于我使用了elmo v2模块,它将一串句子数组转换为它们的单词嵌入,所以我使用了以下代码:import tensorflow_hub as hub#Sentence_array=["I love Python", "python is a good PL"] elmo/ELMO")
embeddings =
当我在Google Drive中打开时,出现一个错误:A network error occurred and the request could not be completed.vrz=colab-20190311-085300-RC00_237811388:1345:363)
at new GG (h