Регулярные выражения в Google analytics

Использования регулярных выражений в гугл аналитикс

Регулярные выражения – это специальные символы, которые используются для фильтрации необходимой информации и в подстановке необходимых знаков. Следует отметить, что в google analytics регулярные выражения имеют ограничения в 256 символов. Также при работе с регулярными выражениями нужно помнить, что описывается каждый элемент строки (каждый символ) отдельно.

В google analytics вы можете использовать регулярные выражения:

1.При фильтрации данных в стандартных отчетов

2.При создании своих отчетов

3.При настройке целей

4.При создании сегментов

5.При создании групп каналов и групп контента

6.При создании фильтров

Спецсимволы

1) Точка (.)

. соответствует любому символу но только одному (букве цифре или символу)

Например: регулярному выражению гуг.л соответствуют значения гугул, гуг7л, но не гугл.

2) Умножение (*)

* соответствует 0 или 1 или более предыдущих символов (предыдущим элементом по умолчанию является предыдущий символ)

67* будет соответствовать 6, 67, 677, 6777…

Например: регулярному выражению pi*el соответствуют значения pipeline, piel, но не pixel

Комбинация .* соответствует 0 или множеству любых элементов.

Например, данная комбинация применяется при объединении рефералов facebook через фильтр

3) Плюс (+)

+ соответствует одному или нескольким предыдущим элементам

Например: регулярному выражению facebo+k соответствуют значения facebook, faceboook, но не facebok.

Комбинация .+ может соответствовать множеству любых символов. Разница между комбинациями регулярных выражений .* и .+ в том что при использовании .+ должно стоять хоть что то.

4) Знак вопроса (?)

? соответствует 0 или 1 элементу.

Например аналит?кс, соответствует аналиткс , аналикс

5) Каретка

^ означает что данные, должны находиться в начале строки

Например: ^аналитикс , соответствует аналитикс, аналитикс гугл, но не «гугл аналитикс»

Если использовать [^] , тогда элементы будут исключаться.

Для примера, исключим поисковые запросы, которые начинаются с букв русского алфавита. Регулярное выражения ^[^а-я]

6) Знак доллара ($)

$ означает что данные, должны находится в конце строки

Например: bi$, соответствует owox bi, oxoxbi, но не «usability» и не owox bi attribution

7) Вертикальная линия (|)

| используется как оператор «или»

Например: При фильтр трех городов Moscow|Petersburg|Rostov

Обратите внимание, что при регулярном выражении Moscow|Petersburg|Rostov, также слова Saint Peterburg, Rostov-on-Don, St.Peterburg.

Если вам необходимо найти точное совпадения городов, тогда данное регулярное выражение будет выглядеть вот так ^Moscow$|^Petersburg$|^Rostov$

8) Круглые скобки ()

() используются, что бы создать элемент для выборки (сгруппировать элементы)

Например, аналитика(а|е) — соответствует, «аналитике» и «аналитика», не соответствует «аналитикс»

Или нужно выбрать страницы с блога с разделов аналитика и программирование о яндексе. Регулярное выражение в таком случае будет /blog/(programmirovanie|analitika)/.*yande(ks|x)

9) Квадратные скобки []

[] создания списка элементов, в котором подставляются элементы для выборки.

Например б[оау]р будет соответствовать бар, бор, бур но не баур, боар.

10) Дефис (-)

— выбор диапазона в котором подставляются числа или буквы.

Например, нужно отфильтровать айфоны с 5 по 8 версию Plus. В данном примере регулярное выражение будет Apple iPhone [5-8]s? Plus

11) Фигурные скобки {}

{} — повторение элементов несколько раз

{1,3} — последний элемент будет повторяться минимум один раз, но не больше 3 раз

{2} — последний элемент повторяется 2 раза

{0,} — соответствует регулярному выражению *

{1,} — соответствует регулярному выражению +

{1,} — соответствует регулярному выражению ?

Например, фильтруем все самсунги серии SM–G серии в которых вторая и третья цифра серии не больше 4.

Регулярное выражение Samsung SM-G9[0-4]{2} , [0-4]{2} – два значения от 0 до 4

12)Обратный слэш (\)

\ преобразует элемент регулярного выражения в обычный символ

Например, если вам нужно исключить ip адреса сотрудников в офисе 13.32.56.144; 13.32.56.145; 13.32.56.146; тогда данное регулярное выражение будет выглядеть следующим образом 13\.32\.56\.14[4-6]

13) Слэш (/)

/ в регулярных выражениях – это начало или конец регулярного выражения. Например /anal.tika/. Если мы хотим, чтобы / считался как символ, а не как специальный символ регулярного выражения, тогда нужно добавить «\». По данному примеру будет \/analitika.

Нужно найти url страницы входа в разделе analitika в названии, которых есть слово gtm

Данное регулярное выражение \/analitika\/.*gtm

Аналогичная ситуация с символом ?, что бы он учитывался при выборке как обычный символ следует добавить «\». Пример \?

\d цифровой символ, соответствует регулярному выражению [0-9]

Например, посмотрим страницы входа в url, которых содержат цифры

\w любая буква, цифра или «_»

Например, исключаем любые буквы, цифры, и «_»

\s символ «пробела»

Разбор комбинации регулярного выражения

Например, находим поисковые запросы, которые содержат более 6 слов (более 6 пробелов). В данном примере регулярное выражения будет ^[^\s]+(\s+[^\s]+){6,} или ^[^\s]{1,}(\s{1,}[^\s]{1,}){6,}

Если его разбить, по кусочкам мы получим набор простых спецсимволов, которые описаны в данной статье:

^[^\s] – начинается не с пробела

+ — соответствует одному или нескольким предыдущим элементам

(\s+[^\s]+) – группируем элемент, который соответствует одному пробелу с одним или несколькими предыдущими элементами (+)

{6,} – повторить минимум 6 раз без ограничений

Если вы хотите задать диапазон количества слов, например 3-4 слова, регулярным выражением будет ^[^\s]+(\s+[^\s]+){2,4}$

Автор
Последние статьи

Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Янв
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31