Програма за писане на политически речи

0
259

Много хора считат, че политическите речи много си приличат по еднаквите тезиси и стандартни формулировки. Създава се впечатление, че съществува алгоритъм, който описва и задава структурата на този тип речи.

 

Валентин Касарниг (Valentin Kassarnig) от Масачузетския университет очевидно много пъти си е задавал въпроса, дали компютърът може самостоятелно да генерира подобни текстове, понеже качи в GitHub програмата Conspeech за генериране на политически речи. Научната работа по темата е публикувана в arxiv.org, а резултатите са учудващо добри.

Касарниг използва база данни с почти 4000 фрагмента от политическите дебати в американския Конгрес. В базата са включени над 50 000 текстови предложения, съдържащи средно 23 думи. Всяка реч от базата е класифицирана по политическа принадлежност – републиканци или демократи, както и по положителното или отрицателното отношение към основната обсъждана тема.

Програмистът е използвал N-грами: последователности от думи и фрази с различна дължина. Програмата първоначално определя частите на речта – съществителни, прилагателни, глаголи и т.н. Алгоритъмът търси всички 6-грами и изчислява вроятността за поява на точно определена дума или фраза, в зависимост от петте предишни грами.

 

На програмата е необходимо да се подаде за коя точно партия да бъде генерирана речта, а алгоритъмът използва база от 6-грами за подадената категория, за да подбере заглавието на речта по псевдослучаен принцип. Програмата изчислява и вероятността за използване на отделните теми в речите, както и какви околни теми се използват.

Кодът на Conspeech е Open Source и всякакви подобрения и нови компилации се препоръчват.

0 0 гласа
Оценете статията
Абонирай се
Извести ме за
guest
0 Коментара
Отзиви
Всички коментари