On the study of crowdsourced labelled data and annotators: beyond noisy labels.
123 p.
Idioma: | English |
---|---|
Publicación: |
2023
|
Materia: | |
Acceso electrónico: |
http://hdl.handle.net/10810/61384 |
id |
oai:addi.ehu.eus:10810-61384 |
---|---|
recordtype |
addi |
spelling |
oai:addi.ehu.eus:10810-613842023-06-16T04:46:40Zcom_10810_12140Doktorego Tesiak;;Tesis Doctoralescom_10810_91IKERKUNTZA;;INVESTIGACIÓNcol_10810_12144DT-Ingeniaritza eta Arkitektura;;TD-Ingeniería y Arquitectura On the study of crowdsourced labelled data and annotators: beyond noisy labels. Beñarán Muñoz, Iker Pérez Martínez, Aritz Hernández González, Jerónimo artificial intelligence informatics inteligencia artificial informática 123 p. La presente tesis incluye 3 contribuciones al área llamada "learning from crowds", que estudia los métodos de aprendizaje basados en datos etiquetados por medio del "crowdsourcing". Estas etiquetas se caracterizan por tener una incertidumbre asociada debido a que la fiabilidad de las personas anotadoras no está garantizada. En primer lugar, se propone un nuevo método de "label aggregation", llamado"domain aware voting", una extensión del popular y simple método "majority voting" que tiene en cuenta la variable descriptiva, obteniendo resultados mejores especialmente cuando hay una mayor escasez de etiquetas. La segunda contribución consiste en la propuesta de un nuevo marco de etiquetado, "candidate labelling", que permite a las personas anotadoras expresar sus dudas acerca de las etiquetas que otorgan,pudiendo otorgar varias etiquetas a cada instancia. Se proponen 2 métodos de "label aggregation"asociados a este tipo de etiquetado, y se muestra, mediante un marco experimental que aúna el etiquetado tradicional y el propuesto, que el "candidate labelling" consigue extraer más información con un mismo número de personas anotadoras. Por último, se desarrolla un modelo de persona anotadora y 2 métodos de aprendizaje adaptados a este nuevo etiquetado, basados en el algoritmo EM, que obtienen mejores resultados en general que los métodos análogos en el marco de etiquetado tradicional. bcam Excelencia Severo Ochoa 2023-06-15T08:44:57Z 2023-06-15T08:44:57Z 2023-05-12 2023-05-12 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10810/61384 661887 18956 eng info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc/3.0/es/ Atribución-NoComercial 3.0 España (cc)2023 IKER BEÑARAN MUÑOZ (cc by-nc 4.0) application/pdf |
external_data_source |
Addi |
institution |
Digital |
collection |
Addi |
language |
English |
topic |
artificial intelligence informatics inteligencia artificial informática |
spellingShingle |
artificial intelligence informatics inteligencia artificial informática Beñarán Muñoz, Iker On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
description |
123 p. |
author_additional |
Pérez Martínez, Aritz |
author |
Beñarán Muñoz, Iker |
title |
On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
title_short |
On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
title_full |
On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
title_fullStr |
On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
title_full_unstemmed |
On the study of crowdsourced labelled data and annotators: beyond noisy labels. |
title_sort |
on the study of crowdsourced labelled data and annotators: beyond noisy labels. |
publishDate |
2023 |
url |
http://hdl.handle.net/10810/61384 |
_version_ |
1769195091569672192 |