-
Surrage_Ghezzi_免疫相关新闻视频编码数据
2026年1月31日 30 73 68
数据集概述 本数据集为论文“Use of immunology in news and YouTube videos in the context of COVID-19: politicization and information bubbles”的原始数据,包含意大利语和英语中与COVID-19免疫相关的新闻文章和视频的编码信息,共1个文件。...
-
SPICE_Based_艺术与情感多语言用户反馈实验数据集
2026年1月29日 30 140 79
数据集概述 本数据集是欧盟SPICE项目下收集的艺术与情感研究数据,包含芬兰语、英语、西班牙语、希伯来语、意大利语5种语言的用户反馈,涉及12件来自都灵GAM博物馆的艺术品。数据记录了用户个人信息及对每件艺术品的5个开放式问题回答,用于训练和测试情感检测模型,共7个文件。 文件详解 多语言用户反馈文件...
-
SIMPITIKI_GITHUB_意大利语文本简化语料库数据
2026年1月29日 30 205 30
数据集概述 本数据集为意大利语文本简化语料库SIMPITIKI,包含两组简化文本对:第一组通过半自动方式从意大利语维基百科获取,第二组从行政领域文档中逐句手动标注。数据集仅含一个XML格式文件,无训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称:simpitiki-v2.xml 文件格式:XML...
-
Phenopackets_Based_多语言基因医学案例集_自动更新版
2026年1月26日 30 96 54
数据集概述 本数据集包含基于Phenopackets生成的多语言基因医学案例集,支持捷克语、中文、荷兰语、英语、德语、意大利语、日语、西班牙语和土耳其语共9种语言,用于LLM研究,会随Phenopacket Store更新自动同步最新HPO翻译和案例数据。 文件详解 压缩文件(ZIP)...
-
PHRAME_RITA_意大利语二语学习者CEFR认证考试文本数据集
2026年1月25日 30 67 56
数据集概述 本数据集为RITA(意大利语测试评估资源),包含意大利语二语学习者为获取CEFR语言能力认证而撰写的学术考试文本,是自然语言处理(NLP)领域的专用数据集。数据由意大利研究部PRIN项目“PHRAME”开发,源自同一项目下的CELI语料库,支持CSV和XML格式的自动处理。 文件详解 文件名称:RITA_PHRAME4.zip...
-
Zenodo_Based_诺拉埃斯科拉庇俄斯圣所叙事数据集_旅游应用支持
2026年1月22日 30 190 12
数据集概述 本数据集为诺拉(普拉,CA)埃斯蒙/埃斯科拉庇俄斯圣所的叙事数据,该圣所自腓尼基时代至罗马晚期均有使用。数据集为考古公园旅游应用开发而构建,包含圣所景点叙事文本、建筑元素叙事文本及对应的意大利语和英语专业录音。 文件详解 音频文件 文件名称:SDE-audio_ITA_storytelling-wav.zip、SDE-...
-
COMMUNI_CARE_Based_胰腺癌诊断医患沟通研究协议转录数据
2026年1月22日 30 162 25
数据集概述 本数据集来自COMMUNI.CARE单中心研究,纳入胰腺癌诊断时的连续患者,收集32组医患互动数据。所有互动经录音、匿名化后转录为意大利语文档,共31个文件,用于研究胰腺癌诊断阶段的医患沟通与患者参与情况。 文件详解 医患沟通转录文档 文件名称:以“PAZIENTE [编号].docx”格式命名(如PAZIENTE...
-
JOST_专业翻译杂志_非二元性别出柜报道中性别公平语言策略的翻译研究数据
2026年1月21日 30 131 65
数据集概述 本数据集为论文“Translating Non-Binary Coming-Out Reports: Gender-Fair Language Strategies and Use in News...
-
Decesare_Based_堕胎立场实验研究_GPT模型生成预设分句数据
2026年1月21日 30 11 9
数据集概述 本数据集为论文“Pro-life, neutral or pro-choice? An experimental study on informative presupposition clefts generated by GPT-3.5 and GPT-4o in Italian, French and...
-
IoT_Hospitality_意大利公民酒店物联网技术态度偏好数据2021
2026年1月20日 30 68 23
数据集概述 本数据集包含2021年10月通过计算机辅助网络问卷收集的1000名意大利公民数据,聚焦酒店场景中面向客户的物联网技术态度与偏好,涵盖人口统计、度假习惯、技术使用态度、服务偏好及付费意愿等内容,原始问卷为意大利语,数据集以Excel文件呈现。 文件详解 文件名称:IoT002a.xlsx 文件格式:XLSX 字段映射介绍:包含3个工作表...
-
CONTRAST_IT_Based意大利语新闻语料库数据集2011_2012
2026年1月20日 30 25 13
数据集概述 本数据集为CONTRAST-IT多语言语料库的意大利语部分,包含2011-2012年从意大利三家电子日报(repubblica.it、lastampa.it、corriere.it)采集的531篇真实新闻文章,总计约三十万字,覆盖政治、体育、科技等多个主题,用于多语言对比语言学研究。 文件详解 意大利语新闻文章文件...
-
dijak_Concordance_Slovenian_Italian双语对照条目数据
2026年1月14日 30 22 6
数据集概述 本数据集展示斯洛文尼亚语术语“dijak(中学生)”与其意大利语对应词的双语对照条目,来源于斯洛文尼亚共和国官方公报中具有法律约束力的斯洛文尼亚-意大利双语文本。包含2004-2024年斯洛文尼亚伊斯特拉地区84份双语出版物的相关内容,涉及学前和初等教育及奖学金领域,用于呈现术语在官方话语中的使用场景、语义差异及翻译选择。 文件详解...
-
Lienz_Kosaken_Based女性命运与哥萨克悲剧虚拟展览技术实现数据2020
2026年1月14日 30 144 78
数据集概述 本数据集包含2020年上线的虚拟展览“Loro condividono il loro destino! Le donne e la tragedia cosacca di Lienz 1945”的全部背景数据,支持访问http://ausstellung.kosaken-...
-
LADDER_Based_意大利语L1_L2学习者数字交流语用能力分析语料库_2021版
2026年1月13日 30 77 18
数据集概述 本数据集为LADDER语料库,包含意大利语母语者及德语背景学习者的数字交流文本,涵盖邮件、WhatsApp即时消息两种媒介,涉及请求、拒绝等言语行为及不同社交距离场景。数据含文本内容及元数据,支持意大利语L2语用能力习得研究,总规模约5.29万词,含多格式文件。 文件详解 CSV格式文件(2个) 文件名称:Mail...
-
dijak_Bilingual_Slovenian_Italian官方公报术语对应条目数据
2026年1月12日 30 116 62
数据集概述 本数据集呈现斯洛文尼亚语术语“dijak(中学生)”与其意大利语对应词的双语对应条目,数据源自斯洛文尼亚共和国官方公报发布的2004-2024年斯洛文尼亚-意大利双语法律文本,含84篇出版物,涵盖学前及初等教育、奖学金相关内容,展示术语在官方话语中的使用场景、语义差异及翻译选择。 文件详解 文件名称:Bilingual...
-
NWRT_Based_意大利_德语双语儿童非词重复任务原始与聚合数据_FinalSelection
2026年1月7日 30 23 11
数据集概述 本数据集包含意大利-德语双语儿童在非词重复任务(NWRT)中的原始及聚合数据,按儿童分组(典型发展组、风险组、发展性语言障碍组)和语音风险有无分组呈现。数据以单个非词为行记录,分为语言特异性(LS)和非特异性(LNS)子集,覆盖意大利语(IT)和德语(GER)两种语言。 文件详解...
-
Survey_Questions_Self_Assessment_瑞士50_人群数字技能多语言自评问卷数据
2025年12月31日 30 146 15
数据集概述 本数据集包含用于瑞士50岁以上人群数字技能自评的问卷,涵盖德语、法语和意大利语三种语言版本。数据旨在评估该群体的数字技能水平,总计包含三份文件。 文件详解 文件名称:Webseite & Word_ALLE Fragen_Französisch.xlsx 文件格式:XLSX...
-
VERVE项目Photovoice共创实验室定性数据集
2025年12月22日 30 15 2
数据集概述 本数据集包含欧盟资助项目VERVE下属Photovoice共创实验室的定性数据,涵盖参与者基于两轮问题创作的94张图片及配套文本,所有数据以意大利语呈现,未包含工作坊小组讨论转录内容。 文件详解 文件名称: Moriggi and Secco 2025_Data set_Photovoice.pdf 文件格式: PDF 内容说明:...
-
PAN18跨域作者身份识别数据集
2025年12月22日 30 34 0
数据集概述 该数据集提供跨域作者身份识别问题的语料库,覆盖英语、法语、意大利语、波兰语、西班牙语5种语言,包含已知候选作者同人小说与未知同人小说,通过JSON文件标注问题信息、真实作者及集合信息。 文件详解 文件名称: pan18-cross-domain-authorship-attribution-dataset.zip 文件格式: ZIP压缩包...
-
Emozionalmente意大利语情感语音众包语料库
2025年12月21日 30 127 90
数据集概述 该数据集是意大利语模拟情感语音众包语料库,包含431名业余演员录制的6902条带标签样本,覆盖愤怒、厌恶等六种基础情绪及中性状态,每条样本对应18个固定句子,标签反映演员的情感表达意图,为意大利语情感语音研究提供数据支持。 文件详解 文件名称: emozionalmente.zip 文件格式: ZIP压缩包 包含内容: 音频文件:...



