Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google

Autores/as

  • Felipe Ovares Barquero Universidad Nacional de Costa Rica , Costa Rica Autor/a
  • José Alberto Rubí Barquero Universidad Nacional de Costa Rica Autor/a

Resumen

En lingüística, principalmente en el idioma inglés, se usa el Índice de Niebla de Gunning para determinar la legibilidad de un texto. El índice estima los años de educación formal necesarios para comprender
el texto en una primera lectura. Un Índice de 11 años apunta a una persona con el colegio finalizado, (Gunning, 1973). Analizamos en esta investigación la variación del Índice al cambiar la forma de obtener uno de los parámetros. En la fórmula original se consideran “palabras complejas” las que tienen tres o más sílabas. En su lugar utilizamos “palabras desconocidas” que son aquellas cuyo uso es poco familiar, según un corpus construido durante la investigación, partiendo de millones de libros digitalizados por Google y la Universidad de Harvard. Aunque la variación de los resultados dependerá del valor asignado para determinar
si una palabra es desconocida la investigación es pionera en el uso de un corpus para calcular el Índice de Niebla.

Descargas

Los datos de descarga aún no están disponibles.

Biografía del autor/a

  • Felipe Ovares Barquero, Universidad Nacional de Costa Rica
    Escuela de Informática
  • José Alberto Rubí Barquero, Universidad Nacional de Costa Rica
    Escuela de Filosofía

Descargas

Publicado

2010-01-01

Número

Sección

Artículos científicos originales (arbitrados por pares académicos)

Cómo citar

Ovares Barquero, F., & Rubí Barquero, J. A. (2010). Variación del índice de niebla usando un corpus obtenido a partir de los libros digitalizados por google. Uniciencia, 24(1), 133-141. https://www.revistas.una.ac.cr/index.php/uniciencia/article/view/380