2 marzo, 2024

CONTAR LAS PALABRAS QUE MÁS REPITEN EN UNA CADENA DE TEXTO CON TYPESCRIPT

Hola a todos,

Hoy voy a escribir dos post, uno de Typescript y otro de Power Apps 🙂

Este es el de Typescript y tratará de responder a la necesidad de obtener las palabras que más repiten en una cadena de texto y mostrar el resultado en una hoja de Excel con un gráfico de jerarquía.

Para hacer el ejercicio he creado una cadena con adjetivos positivos y negativos de forma aleatoria y con elementos repetidos:

Para procesar toda esta información voy a utilizar un script que va a tener en cuenta las letras mayúsculas y minúsculas, las tildes y únicamente las palabras de más de 4 caracteres.

Este es el código:

function main(workbook: ExcelScript.Workbook) {
  var miHoja = workbook.getWorksheet("Hoja1");
    var rango = miHoja.getRange("A1:A10");
    //Pasamos el texto a una cadena única para analizar
    var cadena= rango.getValues().join(" ");
      //Contamos palabras y las ordenamos según frecuencia
  var nPalabras = cuentaPalabras(cadena);
  var sCadena = Object.keys(nPalabras).map(word => {
    return { text: word, size: nPalabras[word] };
    }).sort((a, b) => b.size - a.size);
    // Mostrar las palabras más repetidas en un rango de celdas
  var salidastring = miHoja.getRange("B1:C" + (sCadena.length + 1));
  salidastring.clear();
  salidastring.setValues([["Palabra", "Frecuencia"], ...sCadena.map(word => [word.text, word.size])]);
}
//Función que cuenta las palabras, pasando los datos a minúscula y más de 4 caracteres
function cuentaPalabras(text: string): { [word: string]: number } {
  var contador: { [word: string]: number } = {};
  var word = text.match(/[^\s.,;]+/g);
    word.forEach(palabra => {
        var minusc = palabra.toLowerCase();
      if (minusc.length > 4) {
        contador[minusc] = (contador[minusc] || 0) + 1;
        }
    });
    return contador;
}

El resultado de ejecutar el código es el siguiente:

El código no genera el gráfico (que se podría hacer perfectamente), genera la lista de palabras con la frecuencia.

Como podéis observar, la palabra más frecuente es: encantador

Y esto es todo, aprovecho para comentar que sería muy interesante que pudiésemos utilizar bibliotecas en officescript, dado que nos permitiría comparar con nuestras cadenas de texto y realizar análisis estadísticos.

Espero que sea de utilidad 🙂

¿Te ha resultado de interés?, puedes apoyar a Excel Signum con una pequeña donación.

Donate Button with Credit Cards

¡¡Muchas gracias!!

Mediante la suscripción al blog, la realización comentarios o el uso del formulario de contacto estás dando tu consentimiento expreso al tratamiento de los datos personales proporcionados según lo dispuesto en la ley vigente (LOPD). Tienes más información al respecto en esta página del blog: Política de Privacidad y Cookies

Comparte este post

Si te ha gustado o tienes alguna duda, puedes dejar aquí tu comentario.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies