Strona główna » Blog » Wiedza » Jak mierzyć relacyjność tekstu?

Jak mierzyć relacyjność tekstu?

  • Aplikacje oceniające trudność tekstu zwykle pomijają relacyjność tekstu.
  • Za relacje odpowiadają słowa mówiące o stosunku nadawcy do siebie i do odbiorcy.
  • W aplikacji Logios do zabawy możesz oceniać relacje na kilka sposobów.

Marzenia się spełniają?

Jest takie marzenie wielu psychologów i lingwistów: rozpoznawać stany i cechy człowieka na podstawie płytkiej analizy tekstu. Płytkiej, czyli uwzględniającej cechy powierzchniowe, takie jak częstość określonych słów.

Gdybyż to działało! Moglibyśmy szybko szufladkować ludzi, a nawet stawiać im psychologiczne diagnozy…

Tylko pomyśl:

  • zliczamy stosunek „iż” do „że” i mamy… wskaźnik bufonady,
  • zliczamy stosunek zwrotów bezosobowych do osobowych i mamy… syndrom nieśmiałego zięcia,
  • zliczamy stosunek „ja” do „ty” i diagnozujemy… poziom megalomanii.

Kilka takich teorii stało się nawet podstawą bardzo ciekawych narzędzi IT.

Czy można mierzyć w tekście emocje?

Na przykład z teorii podstawowych emocji Ekhmana zrodziło się przeświadczenie, że można komputerowo badać emocje w tekście. W tych badaniach wykorzystuje się teorię Plutchika. Chcesz zmierzyć sentyment w tekście? Proszę, oto bezpłatny polski program do analizy wydźwięku.

Niestety, niektóre badania podważają istnienie emocji podstawowych, zarówno pierwszych sześciu, jak i kolejnych dwunastu.

Co mówią wyrazy funkcyjne?

Inny przykład to chyba najsłynniejsza w naukach społecznych koncepcja Jamesa Pennebakera i jego program komputerowy LIWC. Program ten wykorzystuje rozbudowaną listę słów do diagnozy ponad 70 stanów kognitywnych.

Ale ciekawsze:

Pennebaker odkrył, że o psychologicznym profilu autora więcej od rzeczowników czy czasowników mówią niepozorne wyrazy funkcyjne, czyli słowa pozbawione samodzielnych znaczeń. Słowa pustaki.

Analiza frekwencji zaimków (on, tam), przyimków (do, z, na), spójników (ale, i) i rodzajników przyniosła kilka ciekawych obserwacji.

Na przykład:

  • osoby, które się ze sobą zgadzają, dostrajają swoje wypowiedzi pod względem zaimków,
  • poeci, którzy w swych wierszach nadużywali „ja”, popełnili samobójstwo,
  • osoby, które nagle unikają „ja”, mogą kłamać,
  • osoby, które używają zaimków osobowych innych niż „ja” (np. ty, on, ona, oni), mają wysokie kompetencje społeczne i lepiej pracują zespołowo.

Sprawdź, jak sam Peenbaker opowiada o swych odkryciach na konferencji TEDx.

A w wolnej chwili zerknij, co potrafi jego aplikacja.

Jak sprawdzać relacyjność tekstu w Logiosie?

No dobrze. Bez spektakularnego przykładu się nie obejdzie. Na warsztat weźmy wpis oryginalnej pod względem stylistycznym autorki z LinkedIn (i nie tylko) – Janiny Bąk.

Przyjrzyjmy się wpisowi o sukcesie książki Janiny:

Krok 1. Trudność tekstu

Zawsze zaczynaj od sprawdzenia poziomu trudności tekstu.

Plain Language Index w tekście Janiny ma aż 90%. Tekst jest bardzo podobny do najpoczytniejszych tekstów w polskim internecie.

Porównajmy jeszcze trudność tematu tekstu Janiny z długością zdań:

Ten wykres pokazuje indywidualną cechę stylu Janiny – rozbudowaną, metaforyczną frazę.

Sam temat jest prosty (mało trudnych słów), ale zdania są literackie. Na przykład fragment o gradzie oposów to szalony ZDANIOPIT, czyli akapit napisany tylko jednym, siedemdziesięciosiedmiowyrazowym zdaniem.

Krok 2. Wskaźnik nieosobistych odniesień Ertela

Przejdźmy do analizy relacyjności. Teksty publikowane w mediach społecznościowych powinny mieć sporo odniesień do czytelników (społeczności). Powinny być – jak pisał Lec – nie tylko do rzeczy, ale też do ludzi!

Na początek sprawdźmy jeden z ciekawszych wskaźników psychologicznych – wskaźnik nieosobistych odniesień. Opracował go Suitbert Ertel w ramach koncepcji stylów mówienia. Dziś wykorzystuje się go do diagnozowania schizofrenii.

Nieosobiste odniesienia to wszystkie zaimki, które autor odnosi do tematu wypowiedzi. Po prostu opisuje nimi świat zewnętrzny – świat poza sobą i czytelnikiem.

  • Jeśli wskaźnik jest wysoki – tekst jest do rzeczy, ale nie do ludzi.
  • Jeśli wskaźnik jest niski – tekst jest bardzo relacyjny.

W tekście Janiny wskaźnik ten jest niski – wynosi tylko 25%. Oznacza to, że aż 75% zaimków autorka odnosi do siebie i swoich czytelników. To jest dopiero relacyjność (nie znam osoby piszącej bardziej relacyjnie na LinkedIn).

(przy okazji – spójrz na wysoki wskaźnik superlatywności i niemal brak tonu formalnego)

Krok 3. Efekt H2H

W analizie relacyjności możemy pójść jeszcze dalej. Wiemy już, że autorka tworzy nie tylko obraz opisywanej rzeczywistości, ale także silne więzi między sobą a czytelnikami.

Ale o kim pisze bardziej? O swoich czytelnikach czy o sobie?

Możesz to sprawdzić, przyglądając się efektowi H2H.

Metoda jest prosta:

  • Pierwsze H – to wszystkie wykładniki nadawcy (ja, dziękuję, mój, nasz).
  • Drugie H – to wszystkie zwroty do czytelnika (kup, Was, otwórzcie).

Efektem H2H da się w 3 sekundy rozbroić z argumentów zwolenników „Witam”. Zwrot ten nie jest błędem. Słaby jest też argument ze staropolskiego gospodarza.

„Witam” to nietakt ze względu na pokazywanie siebie (pierwsze H) na początku wiadomości. To smutna językowa „samojebka” (pardon our French).

Jak zatem wygląda efekt H2H w tekście Janiny?

Poczekaj, możliwości są cztery:

  • H2h – dużo nadawcy, mało odbiorcy – to autoprezentacyjny styl komunikacji,
  • h2H – dużo odbiorcy, mało nadawcy – to instruktażowy styl komunikacji,
  • H2H – dużo nadawcy i dużo odbiorcy – to partnerski styl komunikacji,
  • h2h – mało nadawcy i mało odbiorcy – to formalny styl komunikacji.

Wielkość H/h oznacza wysoką/niską wartość wskaźnika.

Oto wykres z H2H dla tekstu Janiny:

Co widzimy na wykresie?

Oba wskaźniki są na bardzo wysokim poziomie (pomarańczowe osie przekroczone), ale Janiny jest w tekście prawie dwukrotnie więcej niż czytelników. Nasz efekt układa się zatem tak: H2h.

Rzecz jasna – to tylko dane. Kontekst tekstu pozwala nam je lepiej zrozumieć. Wszak Janina napisała tekst o swojej książce (czyli właściwie o sobie). To naturalne, że w tekście jest jej więcej ?

Zawsze są jakieś ale

Oczywiście, istnieje też w naukach społecznych nurt krytyczny wobec komputerowej analizy relacji. To część wielkiej wojny dwóch podejść: jakościowego i ilościowego. Przykład takiej krytyki możecie przeczytać na blogu prof. Dariusza Galasińskiego. To na dobry początek.

Jeśli zastanawiasz się, co Janina myśli o tym artykule – sprawdź.

Komentarze