Словари в Python
В этом руководстве вы узнаете всё о словарях в Python: как их создавать, как добавлять, удалять, как получать из них элементы, а еще познакомитесь со встроенными методами словарей.
Словарь — это неупорядоченный набор элементов. Элемент словаря представляет собой пару ключ: значение . Словари оптимизированы для получения значений по заданному ключу.
Как создать словарь
Чтобы создать словарь в Python, необходимо прописать элементы внутри фигурных скобок <> и разделить их запятыми.
В элементе содержится ключ и соответствующее значение, они записываются так: (ключ: значение) .
В словарях значения могут повторяться и быть любого типа. Ключи же повторяться не могут и должны быть неизменяемым типом (строками, числовыми типами и кортежами с неизменяемыми элементами).
Как вы увидели выше, мы можем создать словарь с помощью встроенной функции dict() .
Как получить элементы из словаря
В отличие от других типов данных, где для доступа к элементам используется индексация, в словаре используются ключи. Они используются внутри квадратных скобок или в качестве аргумента метода get() .
При использовании квадратных скобок и отсутствии элемента в словаре вызывается ошибка KeyError. При использовании метода get() и отсутствии элемента возвращается None .
Вывод:
Как изменить или добавить элементы в словаре
Словари — изменяемый тип данных. Это значит, что в него можно добавить новые элементы или изменить уже существующие с помощью оператора присваивания.
Если добавляемый ключ есть в словаре, значение элемента изменяется. Если же такого ключа еще нет, то в словарь добавляется новая пара (ключ: значение) .
Вывод:
Как удалить элементы из словаря
Удалить нужный элемент словаря по ключу можно с помощью метода pop() . Этот метод удаляет элемент с соответствующим ключом и возвращает значение.
Удалить произвольную пару (ключ, значение) можно с помощью метода popitem() . Очистить весь словарь за один раз можно с помощью метода clear() .
Также можно использовать ключевое слово del для удаления отдельных элементов или же всего словаря.
Вывод:
Методы словарей
В таблице ниже указаны доступные методы словарей. Некоторые из них мы уже использовали в примерах выше.
Метод
Что делает
Удаляет все элементы из словаря
Возвращает неглубокую копию словаря
Возвращает словарь с ключами из seq и значениями, равными v (по умолчанию None )
Возвращает значение ключа key . Если key не существует, возвращает d (по умолчанию None )
Возвращает новый объект элементов словаря в формате (ключ, значение)
Возвращает новый объект с ключами словаря
Удаляет элемент с ключом key и возвращает его значение или d , если key не найден. Если d не было обозначено и key не найден, вызывает ошибку KeyError.
Удаляет и возвращает произвольную пару (ключ, значение) . Вызывае ошибку KeyError, если словарь пустой.
Если ключ key есть в словаре, возвращает соответствующее ему значение. Если нет, добавляет в словарь элемент с ключом key и значением d и возвращает d (по умолчанию None )
Обновляет словарь имеющимися парами ключ/значение из other , перезаписывая существующие ключи
Возвращает новый объект со значениями словаря
Вывод:
Представление словарей
Представление словарей — элегантный и лаконичный способ создать новый словарь из итерируемого объекта.
Представление словарей состоит из выражения ключ: значение , за которым следует for , и всё это — внутри фигурных скобок <> .
Создадим словарь с парами чисел и их квадратов в качестве элементов:
Вывод:
То же самое можно сделать иначе, но так будет длинее:
Вывод:
В представлении словарей выражений for и if опционально может быть больше.
Необязательное выражение if поможет отфильтровать элементы для создания нового словаря.
Давайте создадим словарь только с квадратами только нечетных чисел:
Вывод:
Другие операции со словарями
Проверка на вхождение в словарь
Проверить, есть ли ключ в словаре, можно с помощью ключевого слова in . Отметим, что проверку на вхождение можно провести только над ключами, не над значениями
Вывод:
Итерирование по словарю
Мы можем пройтись по всем ключам словаря, используя цикл for .
Вывод:
Встроенные функции для словарей
Встроенные функции all() , any() , len() , cmp() , sorted() и т. д. часто используются со словарями для разных задач.
Функция
Описание
Возвращает True , если все ключи словаря = True (или если словарь пуст)
Возвращает True , если хотя бы один ключ словаря = True . Если словарь пуст, возвращает False .
Словари и их методы в Python
Словарь — неупорядоченная структура данных, которая позволяет хранить пары «ключ — значение». Вот пример словаря на Python:
Данный словарь использует строки в качестве ключей, однако ключом может являться в принципе любой неизменяемый тип данных. Значением же конкретного ключа может быть что угодно. Вот ещё один пример словаря, где ключами являются числа, а значениями — строки:
Важное уточнение: если вы попробуете использовать изменяемый тип данных в качестве ключа, то получите ошибку:
Прим. перев. На самом деле проблема не с изменяемыми, а с нехэшируемыми типами данных, но обычно это одно и то же.
Получение данных из словаря
Для получения значения конкретного ключа используются квадратные скобки [] . Предположим, что в нашем словаре есть пара ‘марафон’: 26 .
Опять же, вы получите ошибку, если попытаетесь получить значение по несуществующему ключу. Для избежания подобных ошибок существуют методы, о которых мы сейчас поговорим.
Добавление и обновление ключей
Добавление новых пар в словарь происходит достаточно просто:
Обновление существующих значений происходит абсолютно также:
Удаление ключей
Для удаления ключа и соответствующего значения из словаря можно использовать del
Методы
Словари в Python имеют множество различных полезных методов, которые помогут вам в работе с ними. Вот лишь некоторые из них:
Update
Метод update() пригодится, если нужно обновить несколько пар сразу. Метод принимает другой словарь в качестве аргумента.
Если вас интересует, почему данные в словаре расположены не в том порядке, в котором они были внесены в него, то это потому что словари не упорядочены.
Метод get() возвращает значение по указанному ключу. Если указанного ключа не существует, метод вернёт None .
Метод можно использовать для проверки наличия ключей в словаре:
Также можно указать значение по умолчанию, которое будет возвращено вместо None , если ключа в словаре не окажется:
Метод pop() удаляет ключ и возвращает соответствующее ему значение.
Метод keys() возвращает коллекцию ключей в словаре.
Values
Метод values() возвращает коллекцию значений в словаре.
Items
Метод items() возвращает пары «ключ — значение».
Итерация через словарь
Вы можете провести итерацию по каждому ключу в словаре.
Очевидно, вместо story_count можно использовать story_count.keys() .
В примере кода ниже цикл for использует метод items() для получения пары «ключ — значение» на каждую итерацию.
Словари в Python (dict)
У местная аналогия для словаря в языке Python — обычный толковый словарь, где каждому отдельному слову (ключу) соответствует его определение (значение).
А теперь разберёмся подробнее, как в Python устроены словари и как с ними работать.
Что такое словарь и как он устроен
Словари в Python можно считать реализацией структуры данных, более известной как ассоциативный массив.
Способ хранения словаря Python в памяти
Рассмотрим сначала то, как выглядит структура отдельно взятого элемента словаря в pycore_dict.h :
- me_hash — кэшированный хеш-код me_key ;
- *me_key — указатель на объект, содержащий ключ элемента;
- *me_value — указатель на объект, содержащий значение элемента.
Теперь перейдем к облику самой C-структуры словаря в Python:
Выходит, что, при объявлении нового словаря, в памяти создается объект, состоящий из следующих блоков:
- PyObject_HEAD — заголовок;
- Py_ssize_t ma_used — количество элементов словаря;
- uint64_t ma_version_tag — уникальная версия словаря, меняющаяся каждый раз при его обновлении;
- PyDictKeysObject *ma_keys — указатель на массив ключей;
- PyObject **ma_values — массив указателей на значения ключей. Если ma_values IS NULL, то все пары ключ:значение содержатся в ma_keys.
Как и в случае со списками, объект словаря хранит лишь указатели, а не сами значения
Базовая работа со словарями
Объявление словаря
Объявить словарь Python 3 можно несколькими способами. Но сначала рассмотрим наиболее простую ситуацию и создадим пустой словарь:
example_dict = <> print(type(example_dict)) > <class 'dict'>
Теперь объявим и инициализируем словарь из трех элементов через соответствующий литерал и выведем на экран значение третьего элемента:
Помимо литерального объявления, в Python существует возможность объявлять словари при помощи функции dict() :
inventory_dict = dict(right_hand='sword', left_hand='shield') inventory_dict >
Чуть более хитрые способы создания словарей:
Вариант №1 . Если вам необходим словарь, каждому ключу которого сопоставлено одно и то же значение, то можно воспользоваться методом fromkeys() :
# словарь из десяти элементов со значениями, равными 0 zero_array_dict = dict.fromkeys(['a0', 'b0', 'c0', 'd0'], 0) zero_array_dict >
Вариант №2 . С помощью функции-упаковщика zip() , вызванной внутри dict() , вы можете составить словарь из двух списков (в случае несовпадения длин списков, функция самостоятельно отсечет лишние элементы):
key_list = ['marvel_hero', 'dc_hero'] value_list = ['Spiderman', 'Flash'] superhero_dict = dict(zip(key_list, value_list)) superhero_dict >
Обращение к элементу словаря в Python
Извлечь значение элемента словаря можно единственным образом — обратившись к нему по его ключу:
hero_inventory = dict(strong_right_hand='sword', strong_left_hand='shield +3') what_in_right_hand = hero_inventory['strong_right_hand'] # или так: what_in_right_hand = hero_inventory.get('strong_right_hand') print(what_in_right_hand) > sword
В отличие от списков, номеров позиций в словарях нет:
print(any_dict[1]) > Traceback (most recent call last): File "<pyshell#20>", line 1, in <module> print(any_dict[1]) NameError: name 'any_dict' is not defined
Подобная ошибка возникнет и в том случае, если вы, по какой-то причине, вдруг решите извлечь значение по несуществующему ключу.
Добавление нового элемента в словарь
Для того чтобы добавить в словарь новые данные достаточно новому ключу этого словаря назначить какое-либо значение. Добавление выглядит так:
Аналогичным образом можно произвести замену существующего значения по его ключу:
superhero_dict['dc_hero'] = 'Batwoman' print(superhero_dict) >
Удаление элемента из словаря
Для того чтобы удалить запись в словаре воспользуемся оператором del :
# запись “'dark_horse_hero': 'Hellboy'” исчезнет. Прости, Красный! del superhero_dict['dark_horse_hero'] print(superhero_dict) >
Проверка на наличие ключа в словаре Python
Как отмечалось выше, обращение по несуществующему ключу вызывает ошибку в работе интерпретатора. Поэтому, наличие ключа в словаре следует проверять. За это дело отвечает оператор in :
if 'marvel_hero' in superhero_dict: print ("Да, такой ключ есть") else: print("Этот ключ в словаре отсутствует!") > Да, такой ключ есть # запись с ключом 'dark_horse_hero' была удалена нами чуть выше if 'dark_horse_hero' in superhero_dict: print ("Да, такой ключ есть") else: print("Этот ключ в словаре отсутствует!") > Этот ключ в словаре отсутствует!
Кстати говоря, использование метода get() позволяет корректно обработать ситуацию, когда запрашивается значение по несуществующему ключу. Достаточно в качестве второго параметра написать значение по умолчанию:
my_hero = superhero_dict.get('dark_horse_hero', 'Этот ключ в словаре отсутствует!') print(my_hero) > Этот ключ в словаре отсутствует!
Длина словаря в Python
Стоит помнить, что словарь — это лишь набор отображений, а не последовательность, однако количество записей в нём мы все еще можем получить, воспользовавшись функцией len() :
treasure = dict(t1='gold', t2='necklace') num_of_items = len(treasure) print(num_of_items) > 2
Не самая богатая добыча!
Сортировка словаря
Так как словарь состоит из пар, то и отсортировать его можно, как по ключам, так и по значениям.
Сортировка по ключу Сортировка по ключам выполняется с использованием функции sorted() . Работает функция так:
Сортировка по значению А вот — один из вариантов сортировки словаря по значениям:
Здесь стоит учитывать, что, сама по себе, запись sorted(elements.items(), key= lambda x: x[1]) будет возвращать не словарь, а отсортированный список кортежей. Поэтому более правильным вариантом будет:
Перебор словаря в Python
Не является великой тайной и тот факт, что словарь, являющийся, по сути своей, набором пар (т.е. коллекцией), можно всячески итерировать. Один из способов — перебор по ключам:
Другой способ — проитерировать с использованием метода .items() . В этом случае на каждой итерации, пара ключ:значение будет возвращаться к нам в виде кортежа (‘ключ’, значение):
Наконец, мы можем перебрать значения словаря, пользуясь классным методом .values() :
Объединение словарей
Когда заходит речь об объединении двух словарей, то обязательно следует упомянуть, что для пары сущностей типа "словарь" оператор "+"не определен. Причина этого становится довольно очевидной — стоит лишь вспомнить, что словарь не является последовательностью, а также задуматься над тем, какая именно операция на множестве словарей должна быть реализована этим самым оператором "+". Поэтому как-то так:
dict_1 = <'010120': 55000, '030420': 8500, '170420': 30000>dict_2 = <'050520': 2900, '160520': 16573>print(dict_1 + dict_2) Traceback (most recent call last): File "test.py", line 4, in <module> print(dict_1 + dict_2) TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
Ну а если вы всё-таки хотите добиться результата и всё же выполнить объединение двух словарей, то достаточно воспользоваться методом .update() :
Если бы showcase_2 содержал ключи, присутствующие в showcase_1, то значения, ассоциированные с этими ключами, в результирующем словаре были бы взяты именно из showcase_2.
Ограничения
Создавая словарь, вы не должны забывать о некоторых ограничениях, накладываемых, в основном, на его ключи.
- Данные, представляющие собой ключ словаря, должны быть уникальны внутри множества ключей этого словаря. Проще говоря, не должно быть двух одинаковых ключей;
- Ключ должен быть объектом неизменяемого типа, то есть строкой, числом или кортежем. Если говорить строже, то объект содержащий ключ должен быть hashable. То есть иметь хеш-значение, которое не меняется в течение его жизненного цикла;
- На значения нет никаких ограничений. Максимальный уровень свободы. Они не обязаны быть ни уникальными, ни неизменяемыми, поэтому могут себе позволить быть какими угодно.
Методы словарей в Python
Перечислим основные словарные методы, которые помогут вам при работе с этим типом данных.
- clear() — очищает заданный словарь, приводя его к пустому.
- get() — отдаёт значение словаря по указанному ключу. Если ключ не существует, а в качестве дополнительного аргумента передано значение по умолчанию, то метод вернет его. Если же значение по умолчанию опущено, метод вернет None.
- items() — возвращает словарные пары ключ:значение, как соответствующие им кортежи.
- keys() — возвращает ключи словаря, организованные в виде списка.
- values() — подобным образом, возвращает список значений словаря.
- pop() — удалит запись словаря по ключу и вернет её значение.
- popitem() — выбрасывает пару ключ:значение из словаря и возвращает её в качестве кортежа. Такие пары возвращаются в порядке LIFO.
- update() — реализует своеобразную операцию конкатенации для словарей. Он объединяет ключи и значения одного словаря с ключами и значениями другого. При этом если какие-то ключи совпадут, то результирующим значением станет значение словаря, указанного в качестве аргумента метода update.
- copy() — создает полную копию исходного словаря.
Приведение Python-словарей к другим типам
dict → json
Чтобы сериализовать словарь в json формат, сперва необходимо импортировать сам модуль json:
Теперь можно развлекаться. Существует два схожих метода:
- dump() позволит вам конвертировать питоновские словари в json объекты и сохранять их в файлы на вашем компьютере. Это несколько напоминает работу с csv.
- dumps() запишет словарь в строку Python, но согласно json-формату.
dict → list
Для конвертации dict в list достаточно проитерировать словарь попарно с помощью метода items() , и, на каждой итерации, добавлять пару ключ:значение к заранее созданному списку. На выходе получим список списков, где каждый подсписок есть пара из исходного словаря.
medicine_chest = dict(top_part='potion', bot_part='bandage') medicine_list = [] for key, con in medicine_chest.items(): temp = [key, con] medicine_list.append(temp) print(medicine_list) > [['top_part', 'potion'], ['bot_part', ' bandage']]
dict → string
Как указывалось выше, привести словарь к строке (str) можно при помощи модуля json . Но, если словарь не слишком большой, то эквивалентного результата можно добиться, используя стандартную функцию str() :
food_machine = dict(tier_1='juice', tier_2='chocolate') f_machine_str = str(food_machine) print(f_machine_str) >
Генератор словарей
В Python существует возможность создавать словари с помощью генераторов. Генераторы выполняют цикл, отбирают key:value пары на каждой итерации и заполняют, таким образом, новый словарь.
Создадим словарь, где нескольким элементам ряда натуральных чисел приводятся в соответствие их квадраты:
Также генератор удобен, когда нужно инициализировать какой-то имеющийся список ключей:
Вложенные словари
Отдельного упоминания заслуживает тот факт, что элемент словаря может принимать в качестве значения другой словарь:
Число уровней вложенности словарей неограниченно!
Альтернативы словарям
Есть такой модуль, который называется collections . В нем представлены альтернативные словарям типы данных: OrderedDict , defaultdict и Counter . Они близки словарям по сути, но имеют несколько расширенный функционал.
OrderedDict
OrderedDict, можно сказать, является обычным словарем, который, однако, запоминает порядок добавления в него ключей. А, значит, у метода popitem() появляется возможность, через присвоение параметру last значений False или True , указывать какой элемент нужно удалить: первый или последний.
defaultdict
Это подмножество словарей также, на первый взгляд, очень похоже на обычный dict. Но и тут есть свои тонкости. В частности, defaultdict , при отсутствии ключа, всегда присваивает значение по умолчанию, если его пытаются извлечь. Соответственно, KeyError вы больше не увидите.
Counter
Counter — подтип словаря, подсчитывающий и хранящий количество совпадающих неизменяемых элементов последовательности. Однако Counter() обладает и своими небезынтересными методами:
- elements() — метод возвращает список элементов в лексикографическом порядке;
- most_common(num) — возвращает num элементов, которые встречаются в последовательности чаще всего;
- subtract() — метод вычитает количество элементов, присутствующих в итерируемом или map объекте из вычисляемого объекта.
Наверно вы заметили, что словари и списки (о которых, кстати, вы можете почитать в нашей предыдущей статье " Списки в Python ") схожи как, внешне, так и в том, что могут изменять свой размер по необходимости.
Вообще говоря, и списки и словари — это изменяемые объекты, однако операции, провоцирующие изменения для этих типов данных, различны. Различаются они ещё и тем, что элементы словарей сохраняются по ключам, а не по позициям. Так или иначе, оба типа коллекций входят в число наиболее важных и часто применяемых на практике в языке Python.