Публикации с меткой «zip»

Изучаем Django

List clustering

Today I will tell you about just one line of code:

zip(*[a.__iter__()]*3)

So, if you know, how it works, you can skip to the comments right now. :)

This statement may look short and simple but it's actually very interesting and, sometimes, useful Python construction. In a job interviews we ask people to tell how does it work. If a person gets along with it, well, this is a good sign.

Here is the example of what it does:

>>> a = [1,2,3,4,5,6,7,8,10]
>>> zip(*[a.__iter__()]*3)
[(1, 2, 3), (4, 5, 6), (7, 8, 10)]

Lets look at it piecemeal.

__iter__()

Returns iterator object for a list (or tuple or any other iterable object).

This method is used by the interpreter when he encounters a list in, for example, a for loop.

The iterator object by itself has a next() method, which returns list items one by one.

[]*3

Multiplication of a list creates a new list repeating given amount of times the items from source list:

>>> [1,2,3] * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]

Important thing here: all identifiers in Python are references. It means that [a.__iter__()]*3 gives us a list of three references on the same iterator object.

A little example (note the address of listiterator object is the same):

>>> iters = [a.__iter__()]*3
>>> print iters
[<listiterator object at 0x85db0>, <listiterator object at 0x85db0>, <listiterator object at 0x85db0>]
>>> (iters[0].next(), iters[1].next(), iters[2].next())
(1, 2, 3)

*

Takes an iterable object and passes it's members to a function as non-keyword arguments.

This is one of my favourite Python features. The following lines are equivalent:

my_func(*[1,2,3])
my_func(1,2,3)

zip

zip returns a list of tuples, where the i-th tuple consists of i-th member of each function argument. For example:

>>> zip((1,2), (3,4), (4,5))
[(1, 3, 4), (2, 4, 5)]

Official Python documentation declares:

The left-to-right evaluation order of the iterables is guaranteed. This makes possible an idiom for clustering a data series into n-length groups using zip(*[iter(s)]*n).

You may have noticed the construction we are trying to understand here. So, this isn't some Perl one-liner, but an official Python feature.

Use the power of Python,
and may the Force be with you.

Изучаем Django

Кластеризация списка (List clusterization)

И снова здравствуйте :)

Давненько я не писал, и с того времени произошло много хороших вещей:

  • Вышла бета Django 1.2, в ней огромное количество позитивных изменений. Такое чувство, что мне не хватало каждого из них. Взять хотя бы smart if tag, object-level permissions, session messages и улучшения интернационализации (теперь дата форматируется согласно текущей локали по умолчанию).

    Более подробно об этих изменениях вы можете прочитать на замечательном сайте Django Advent, статьи из которого, кстати, я собираюсь переводить и публиковать в этом блоге.

    Следите за обновлениями.

  • На работе мы стали использовать pip, очень удобная вещь на мой взгляд.

    Вот, например, файл зависимостей из одного проекта:

    Django==1.1
    south==0.6.2
    django-debug-toolbar==0.8.1
    django-extensions==0.4.1
    django-notification==0.1.2 #0.1.3-4 has a bug in lockfile.py
    django-messages==0.4.2
    django-sphinx==2.1.2
    supercaptcha==0.1.1
    -e svn+http://django-session-messages.googlecode.com/svn/trunk@5#egg=django-session-messages
    http://github.com/sunlightlabs/django-blogdor/zipball/65adc834b3255e82ea7eb3efa484af49a7438f62
    django-markupfield==0.3.0 #blogdor use
    el-django-compress==1.0.3 # problems with installing original django-compress
    sorl-thumbnail==3.2.5
    
    # apps
    --requirement=apps/facebook_login/libs.txt
    --requirement=apps/twitter_login/libs.txt
    --requirement=apps/payment/libs.txt
  • Перешли с deseb на South.

    Фактически deseb не работал у нас в команде, в самых простых случаях он помогал, но не больше. Для применения изменений на боевом сервере, я бы точно не стал его использовать.

    На South я возлагаю большие надежды. Он использует другой подход, и этот подход действительно работает! После периода "привыкания" команды, можно сказать, что он нам подходит. Любой разработчик запускает migrare и о чудо, база данных станет актуальной. Точно так же можно без опаски запускать его на сервере.

    Подробнее об этом расскажу в следующем посте.

  • 27 марта в Санкт-Петербурге, я буду выступать с докладом на конференции ZFConf 2010, посвященной PHP Zend Framework, приходите, кому интересно :)

Кластеризация списка (List clusterization)

Сегодня я буду рассказывать всего-лишь об одной строчке кода:

zip(*[a.__iter__()]*3)

Если вы знаете как она работает, можете дальше не читать ;)

Не смотря на внешнюю простоту, это очень интересная (и иногда полезная) конструкция Python. На собеседованиях мы просим объяснить как она работает, если человек справляется, это хороший знак.

Полный пример работы кластеризации:

>>> a = [1,2,3,4,5,6,7,8,10]
>>> zip(*[a.__iter__()]*3)
[(1, 2, 3), (4, 5, 6), (7, 8, 10)]

Разберем эту конструкцию по частям.

__iter__()

Возвращает объект-итератор для списка (кортежа или любого другого итерируемого элемента).

Этот метод используется интерпретатором, когда список попадает, например, в цикл for.

Сам объект итератор имеет метод next(), который один-за-другим возвращает элементы списка.

[]*3

Операция умножения для списков формирует новый список, используя элементы начального заданное количество раз.

>>> [1,2,3] * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]

Здесь важный момент, объектные переменные в Python это ссылки. То есть конструкция [a.__iter__()]*3 даст нам список из трех ссылок на один и тот же итератор списка. Небольшой пример:

>>> iters = [a.__iter__()]*3
>>> print iters
[<listiterator object at 0x85db0>, <listiterator object at 0x85db0>, <listiterator object at 0x85db0>]
>>> (iters[0].next(), iters[1].next(), iters[2].next())
(1, 2, 3)

*

Превращает итерируемый объект в список неименованных аргументов функции.

Одна из моих любимых возможностей Python. Следующие конструкции эквивалентны:

my_func(*[1,2,3])
my_func(1,2,3)

zip

zip возращает список кортежей, где i-тый кортеж состоит из i-того элемента каждого из агрументов функции. Например:

>>> zip((1,2), (3,4), (4,5))
[(1, 3, 4), (2, 4, 5)]

В официальной документации к функции zip описана последняя особенность, благодаря которой кластеризация работает.

The left-to-right evaluation order of the iterables is guaranteed. This makes possible an idiom for clustering a data series into n-length groups using zip(*[iter(s)]*n).

Как вы заметили, там содержится и рассматриваемая нами конструкция. Так что это не какой-нибудь однострочник на перле, а вполне официальная особенность. Пользуйтесь на здоровье.

А какие интересные конструкции Python знаете вы?

Метки

.net .NET C# .sort 1.2 2009 2010 404 error admin ajax amazon analytics and apache api archlinux asp.net async asynchronous autocomplete bash blender blog blogengine blogs book bootstrap bot bpython buildout byteflow bzr C c plus plus C++ cache cbv Chaco checkio chrome ci ckeditor class based views clojure closure cms cms с удобной админкой code coding style collectd COM comet competition conference ConfigParser contest Context continuous integration CouchDB coverage CppCMS cpyext cpython crud csrf CSS ctypes curl custom model fields cx_freeze cython database db dbm dbqueries debian debug debugging decorator decorators deploy deployment descriptor design dev devconf developers development diveintopython Django django 1.2 django 1.3 django advent django framework django template django trunk django weblog django-admin-tools django-cms django-compressor django-hosts django-piston django-registration django-sphinx django.admin djangoadvent djangocms djangodash doc documentation drupal e-legion eclipse EGit emacs encoding Enthought epoll erlang event exception ExtJS fabric facebook fastcgi finaloption fixtures fonts forms formset fp framework freebsd freeswitch fs2web ftp fun funcparserlib functional gae gamin gandi generic views gettext gevent gil git github gitosis Google Google App Engine google picasa Google Translate google wave Google Web Toolkit grab grablab greenlet gtd gui haskell hg hgshelve highlighter host hosting how-to howto html html5lib Hudson humor i18n icfpc ide idiomatic image-scripting improvements Internet interpreter ipython ironpython izmenimsya.ru jabber java javascript jenkins jetbrains JIT job jquery json jstree jython kde kiev kiyv kyivpy l10n ldap library libs Life Links linux Linux & Unix LLVM logging logs lxml Mac OS X magic mail markdown Matplotlib Mayavi maybe mediavirus meetup memcache Memcached memory messages metaclass middleware migration mikrotik mkd model models mod_python mod_wsgi mongodb monitoring mptt musicmans.ru musicx mvc my-projects mysql netCDF networkx newforms newforms-admin news nginx Nhibernate nix nose NoSQL numpy oop open source OpenID openoffice opster optimization oracle orm os pagination parsing path patterns pdf PDF-принтер PEP PEP8 performance performance optimization perl personality photo php picture-driven computing PIL pinax pingback pip plasma plone plugin plugins postgresql programming progress bar psycopg2 py2exe pybb pybbm pycamp pycharm pycon pycow pycurl pydev pygtk pylons PyNGL pypy pyqt PyQt4 pyrad pyramid PySide Python Python 2.5 python 2.7 python 3 python c api python speed python-mssql python3 pywinauto Qt Qt4 queue rabbitmq radius raw sql re redis redsolution redsolution cms regexp regular expressions release repoze.bfg RequestContext reusable apps robokassa rss ru ruby ruby-on-rails sample satchmo scalability SciPy scraping screencast search selenium self.error seo server setattr settings setuptools shell sikuli sms snippet socket.io software sorting south sphinx spider sql sqlalchemy sqlite ssh startup step-by-step subdomain subversion svn SyntaxHighlighter system tags tdd tddspry teh drama template templates templatetags test testing thinkpad threading threads tips tips and tricks tools tornadio tornado tornado server tricks tutorial tweepy twisted twitter typography uapycon Ubuntu ucsvlog uml Uncategorized unicode unit test unit testing UnitTest Unladen Swallow upload urllib urls utf-8 uwsgi validation vcs versioning video vim virtualenv Visual Studio vkontakte voip wave web web-devel web-services web-разработка webdev webfaction webkit webpy websockets webtest widget widgets Win API windows Wirbel work wrapper wsgi wxPython wxWidgets wysiwyg xapian xml xmonad xmpp xpath yandex youtube zip zomg zope [cdata[cbv]] [cdata[ci]] [cdata[class based views]] [cdata[continuous integration]] [cdata[django framework]] [cdata[django-sphinx]] [cdata[django]] [cdata[nginx]] [cdata[python]] [cdata[virtualenv]] [cdata[программирование]] автоматизация администрирование администрирование django админка алгоритмы архитектура атрибуты базы данных Без рубрики безопасность библиотеки блоге бот веб-разработка видео Визуализация данных вконтакте Все записи гвидо ван россум граббер графика графы декоратор декораторы дескриптор дескрипторы документация заметки игра жизнь идея интересное киев Клиентам книги конференция личное математика метаклассы модели модули монады морфология мысли невозможное новости о облачные вычисления обо мне Обработка данных оптимизация оптимизация кода Основная лента основы парсинг парсинг сайтов перевод песочница Питон поебень поиск правила кодирования программирование Проектирование производительность работа рабочее размышлизмы Разное разработка разработка приложений разработки регулярные выражения сайт событие события ссылки статьи тестирование тесты Тюмень убунтариум фигня философия формы форум Хабрахабр хакинг хостинг шаблоны шаблоны проектирования эксперимент Эксперименты юмор я пиарюсь Яндекс