Microsoft Azure Translator API 可以翻译带有 HTML 标签的文本吗?

问题描述 投票:0回答:1

我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。

我注意到,对于一种情况,href 标签并没有翻译它,它只是将 href 标题“两列”替换为“,”。

有什么想法吗?或者我应该去掉 HTML 标签? 是否有限制或者我应该添加一些内容才能获得正确的翻译?

英文文本:

你如何开始?

选择“编辑”开始使用这个基本的两列模板,重点是文本和文本格式示例。当页面处于编辑模式时,选择该段落并将其替换为您自己的文本。然后,选择基本两列模板标题并替换它。在标题下的页面作者字段中输入您的姓名。

您刚刚编辑了页面模板,并且即将将此页面变成您自己的页面!

 

丹麦语翻译文本:

Miten pääset alkuun?

Valitse 'Muokkaa' aloittaaksesi työskentelyn tämän kaksipalstaisen perusmallin ,jossa painotetaan tekstiä ja esimerkkejä tekstin muotoilusta。 Kun sivu on muokkaustilassa,valitse tämä kappale ja korvaa se omalla tekstilläsi。 Valitse Sitten kaksisarakkeisen mallin perusotsikko ja korvaa se myös。 Kirjoita nimesi sivun tekijäkenttään otsikon alle。

Olet juuri muokannut sivumallia ja olet matkalla tekemään tästä sivusta omanlaisesi!

 

我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。我希望无论 HTML 标签如何都能获得文本翻译,但返回的翻译通过将 href 标题替换为逗号而错过了文本。

azure azure-cognitive-services azure-ai-translator
1个回答
0
投票

我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。

翻译服务在翻译包含 HTML 标记的文本时经常遇到困难。 Trans API 可能并不总是正确处理 HTML 标签,有时会产生意外结果,例如替换部分文本或遗漏某些元素。

  • 这里有使用 Azure Translator API 翻译包含 HTML 标签的文本的示例代码:
from azure.core.credentials import AzureKeyCredential
from azure.ai.translation.document import DocumentTranslationClient
from azure.ai.translation.document import DocumentTranslationInput, TranslationTarget

# Replace these variables with your Azure subscription key and endpoint
azure_key = "YOUR_AZURE_SUBSCRIPTION_KEY"
azure_endpoint = "YOUR_AZURE_ENDPOINT"

# Initialize Azure credentials
credential = AzureKeyCredential(azure_key)
client = DocumentTranslationClient(azure_endpoint, credential)

# Sample English text with HTML tags
english_html_text = """
How do you get started?
Select 'Edit' to start working with this basic <a href="example.com">two-column</a> template with an emphasis on text and examples of text formatting.
"""

# Define translation inputs
inputs = [DocumentTranslationInput(
    source_url=None,
    source_text=english_html_text,
    targets=[TranslationTarget(language="fi"), TranslationTarget(language="da")]
)]

# Translate the text
result = client.begin_translation(inputs)

# Get the translation results
translated_texts = []
for doc in result.result():
    translated_texts.append(doc.translations[0].translated_text)

# Print the translated text
print("Finnish Translation:")
print(translated_texts[0])

print("\nDanish Translation:")
print(translated_texts[1])

输出: enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.