Après avoir vu la récupération des URLs pour l'espagnol et le français, on s'attaque maintenant à la constitution du corpus côté Anglophone et turcophone. A noter que la version anglophone de French kiss restera bien évidemment French kiss , et que la version turc sera : " Fransız öpücüğü ". Démonstration : Comme pour la langue espagnole et française, on commence par extraire les URLs sur le terminale de ubuntu. Récolte des URLs Anglais : La commande utilisée pour y procéder : counter=0; while [ $counter -le 300 ]; do lynx -dump "https://www.google.com/search?q=%22french+kiss%22&lr=lang_en&cr=countryUK%7CcountryGB&hl=en&as_qdr=all&tbs=lr:lang_1en,ctr:countryUK%7CcountryGB&sxsrf=ALeKk035znO7MnlS20oHUA1OFucKsI-3uA:1607455178745&ei=ytHPX_b6LMWIae7TqbAG&start=$counter&sa=N&ved=2ahUKEwj2h6-Xjb_tAhVFRBoKHe5pCmYQ8tMDegQIDhA7" >> uk_urls.txt; counter=$(($counter + 20));done //!\\ On fait bien attention de changer le &qu