Menu
Por: Ruth Segarra, con modificaciones por José Luis Gómez Muñoz La Chi cuadrada es un cálculo para saber qué tan cerca o lejos está nuestra hipótesis del conjunto de datos (cantidad esperada) de nuestros datos reales; y se representa por la siguiente fórmula: Donde Ei es la cantidad teórica o esperada de veces que la suma debería dar i, y Oi es la cantidad observada o real de veces que la suma da i. El primer paso para calcular nuestra Chi cuadrada es, plantear la hipótesis que se refutará o comprobará con el experimento que se realizará al comparar la Chi de prueba (que se encuentra gracias a las frecuencias esperadas), con la Chi cuadrado crítico (que se encuentra al calcular los grados en libertad o variables independientes). Donde, entre más pequeño sea el resultado, más cerca estará el dato esperado al objetivo. A continuación, un ejemplo del uso correcto de la Chi cuadrada para saber qué tan “lejos” están los idiomas Español, Inglés, Francés, Alemán y Portugués uno del otro, tomando como texto la siguiente parte de la canción Just Hold On de Louis Tomlinson: ”What do you do when a chapter ends? Do you close the book and never read it again? Where do you go when your story's done? You can be who you were or who you'll become. If it all goes wrong darling, just hold on.” El texto es traducido a cada uno de los idiomas mencionados, y se usar la Chi cuadrada para comparar cuantas veces aparecen las letras en el verso con la cantidad de veces que aparecen las letras en cada idioma. Los cálculos y gráficas mostrados más abajo fueron hechos con la siguiente hoja de cálculo, hecha por Ruth Segarra, basándose en un trabajo previo de la estudiante Ana Paula, de Prepa Tec CEM:
Conclusiones:
1. Español: El experimento en Excel arrojó que la Chi cuadrada más pequeña del texto en español era el idioma Español. Asimismo, el orden de los idiomas del más alejado (Chi cuadrada mayor) al más cercano (Chi cuadrada menor), respecto al idioma Español es: Alemán, Inglés, Francés y Portugués. 2. Inglés: El experimento en Excel arrojó que la Chi cuadrada más pequeña del texto en inglés era el idioma Inglés. Asimismo, el orden de los idiomas del más alejado (Chi cuadrada mayor) al más cercano (Chi cuadrada menor), respecto al idioma Inglés es: Alemán, Francés, Español y Portugués. 3. Francés: El experimento en Excel arrojó que la Chi cuadrada más pequeña del texto en francés era el idioma Francés. Asimismo, el orden de los idiomas del más alejado (Chi cuadrada mayor) al más cercano (Chi cuadrada menor), respecto al idioma Francés es: Alemán, Español, Inglés y Portugués. 4. Alemán: El experimento en Excel arrojó que la Chi cuadrada más pequeña del texto en alemán era el idioma Alemán. Asimismo, el orden de los idiomas del más alejado (Chi cuadrada mayor) al más cercano (Chi cuadrada menor), respecto al idioma Alemán es: Portugués, Español, Francés e Inglés. 5. Portugués: El experimento en Excel arrojó que la Chi cuadrada más pequeña del texto en portugués era el idioma Portugués. Asimismo, el orden de los idiomas del más alejado (Chi cuadrada mayor) al más cercano (Chi cuadrada menor), respecto al idioma Portugués es: Alemán, Inglés, Francés y Español. La hoja de cálculo pudo identificar correctamente en cada caso en qué idioma estaba el verso, mediante la mínima Chi cuadrada que compara la frecuencia de sus letras con la frecuencia esperada en cada idioma. Además se puede concluir que el idioma Alemán es el idioma mas lejano a todos los demás, siendo que la Chi cuadrada que arrojó el Excel en cada experimento respecto a este idioma, siempre fue mayor a todos los demás en los textos que no estaban en Alemán. Por su parte, el idioma Portugués fue el que tuvo menor diferencia en la Chi cuadrada final respecto a los idiomas: Español, Inglés y Francés. En la siguiente liga puedes ver un video Tik Tok, por el estudiante Claudio Yael, acerca de este mismo tema: www.tiktok.com/@ryuubalam/video/7038608442625445125
0 Comentarios
Deja una respuesta. |
IDMIngeniería en Ciencia de Datos y Matemáticas Archivos
Junio 2019
Categorías
Todos
|