Як напісаць і праверыць фільтры рэгулярных выразаў для Google Analytics (з прыкладамі)

Рэгулярныя выразы Regex Google Analytics Фільтры

Як і ў многіх маіх артыкулах тут, я раблю даследаванні для кліента, а потым пішу пра гэта тут. Шчыра кажучы, ёсць некалькі прычын, па якіх ... па-першае, у мяне жудасная памяць і часта я шукаю інфармацыю на ўласным сайце. Другое - дапамагчы іншым, хто таксама можа шукаць інфармацыю.

Што такое рэгулярны выраз (Regex)?

Regex - гэта метад распрацоўкі для пошуку і вызначэння шаблону сімвалаў у тэксце, які адпавядае альбо замяняе тэкст. Усе сучасныя мовы праграмавання падтрымліваюць рэгулярныя выразы.

Я люблю рэгулярныя выразы (regex), але яны могуць быць крыху расчаравальнымі і раз'юшанымі, каб даведацца і праверыць. Аналітыка Google мае некалькі дзівосных магчымасцей ... дзе вы можаце ствараць прагляды з дапамогай рэгулярных выразаў або фільтраваць свае дадзеныя ў рамках рэгулярных выразаў.

Напрыклад, калі я хацеў бачыць толькі трафік на сваіх старонках тэгаў, я мог бы адфільтраваць / tag / у маёй структуры пастаяннай спасылкі, выкарыстоўваючы:

/tag\/

Сінтаксіс там крытычна важны. Калі б я проста выкарыстаў "тэг", я б атрымаў усе старонкі з тэрмінам тэг. Калі я выкарыстаў «/ тэг», то любы URL, які пачынаецца з тэга, будзе ўключаны, напрыклад / кіраванне тэгамі таму што Google Analytics па змаўчанні ўключае любы знак пасля рэгулярнага выразу. Такім чынам, мне трэба пераканацца, што ў мяне ўключана наступная слэш ... але на ёй павінен быць сімвал уцёкаў.

старонка фільтра старонак

Асновы сінтаксісу рэгулярных выразаў

сінтаксіс апісанне
^ Пачынаецца з
$ Заканчваецца с
. Падстаноўны знак для любога персанажа
* Нуль і больш папярэдняга пункта
.* Адпавядае любым сімвалам у
? Нуль альбо адзін раз папярэдняга элемента
+ Адзін ці некалькі разоў папярэдняга пункта
| Аператар АБО
[abc] A або b або c (можа мець любую колькасць сімвалаў)
[аз] Дыяпазон ад a да z (можа складаць любую колькасць сімвалаў)
[AZ] Дыяпазон ад А да Я (з вялікай літары)
[0-9] Дыяпазон ад 0 да 9 (можа быць любым нумарам)
[a-zA-Z] Дыяпазон ад А да Я альбо А ад Я
[a-zA-Z0-9] Усе літарна-лічбавыя сімвалы
1 {} Роўна 1 асобнік (можа быць любым нумарам)
{1-4} Дыяпазон ад 1 да 4 асобнікаў (можа быць любым лікам)
{1,} 1 або некалькі асобнікаў (можа быць любым нумарам)
() Згрупуйце свае правілы
\ Уцёкі спецыяльных персанажаў
\d Лічбавы сімвал
\D Незначны сімвал
\s Белая прастора
\S Непрабел
\w Слова
\W Неслоўныя (знакі прыпынку)

Прыклады рэгулярных выразаў для Google Analytics

Такім чынам, давайце прыклады для некаторых Спецыяльныя фільтры. Адзін з маіх калегаў папрасіў мяне дапамагчы ў вызначэнні ўнутранай старонкі са шляхам / паказальнік у дадатак да ўсіх паведамленняў у блогу, якія былі напісаны з годам у пастаяннай спасылцы:

Мой уласны шаблон фільтра для поля фільтра Запыт URL:

^/(index|[0-9]{4}\/)

У асноўным гэта сцвярджае, што трэба шукаць / індэксаваць АБО любы 4-значны лікавы шлях, які сканчаецца слэшам. Я стварыў прадстаўленне ў Analytics і дадаў гэта як фільтр:

Фільтр прагляду Google Analytics

Вось яшчэ некалькі прыкладаў:

  • У вас ёсць блог з годам у шляху пастаяннай спасылкі па URL, і вы хочаце адфільтраваць спіс па любым годзе. Такім чынам, я хачу любыя 4 лічбавыя лічбы, пасля якіх ідзе слэш. Запыт шаблону фільтра URl:

^/[0-9]{4}\/

  • Вы хочаце параўнаць усе свае старонкі, дзе ёсць загаловак сертыфікат or сертыфікацыя ў ім. Шаблон фільтра загалоўка старонкі:

(.*)certificat(.*)

  • Вы хочаце параўнаць дзве мэтавыя старонкі на аснове іх агітацыйнага асяроддзя, перададзенага ў URL кампаніі Google Analytics як utm_medium = прамая пошта or платнага пошуку.

(direct\smail|paid\ssearch)

  • Вы хочаце параўнаць усе тавары, якія з'яўляюцца мужчынскімі кашулямі, на аснове URL-шляху. Запыт шаблону фільтра URl:

^/mens/shirt/(.*)

  • Вы хочаце параўнаць усе старонкі з нумараваным шляхам URL, які заканчваецца нумарам. Запыт шаблону фільтра URl:

^/page/[1-9]*/$

  • Вы хочаце выключыць шэраг IP-адрасоў. Выключыць шаблон фільтра IP-адрасоў:

123\.456\.789\.[0-9]

  • Вы хочаце ўключыць старонку thankyou.html, дзе адпраўка прайшла паспяхова на аснове радка запыту success = true. Запыт шаблону фільтра URl:

thankyou\.html\?success=true

Як праверыць выразы рэгулярных выразаў

Замест спроб і памылак у Google Analytics я часта пераходжу да regex101, фантастычны інструмент для праверкі вашых рэгулярных выразаў. Ён нават разбівае для вас ваш сінтаксіс і дае падрабязнасці вашага рэгулярнага выразу:

рэгулярныя выразы regex101

Стварэнне, тэставанне і адладка рэгулярнага выраза

Што вы думаеце?

Гэты сайт выкарыстоўвае Akismet для барацьбы са спамам. Даведайцеся, як дадзеныя апрацоўваюцца каментар.