[devel] re APT patch: Use same [32bit] type for all offsets to dynamically allocated map

Aleksei Nikiforov darktemplar на altlinux.org
Чт Фев 13 15:33:00 MSK 2020


13.02.2020 08:34, Ivan Zakharyaschev пишет:
> 
> On Thu, 13 Feb 2020, Ivan Zakharyaschev wrote:
> 
>> Со временем я замечаю больше тонкостей про memory management в APT,
>> например, обратил-таки когда-то внимание на следующее место в mmap.h:
>>
>> /* This should be a 32 bit type, larger tyes use too much ram and smaller
>>     types are too small. Where ever possible 'unsigned long' should be used
>>     instead of this internal type */
>> typedef unsigned int map_ptrloc;
>>
>> Я пытался догадаться, что имели в виду авторы, и подумал, что когда
>> нам нужно хранить указатель в структуре, попадающей в область памяти,
>> отмапленную в файл ("кеш" информации о всех пакетах), то мы хотим
>> чтобы это всё занимало поменьше места и вместо указателя храним в
>> структуре "индекс" (offset) в массиве, соответствующем этой области, и
>> делаем его 32-битным (грубо говоря). (На LP64-платформах, таких как
>> x86_64, int 32битный.)
>>
>> При этом авторы призывают где возможно использовать unsigned long
>> (64-бита, как и указатели, на x86_64). "Где возможно" -- это, наверное,
>> до тех пор, пока мы индекс не записываем в структуру, которая будет
>> сохранена в этом мапе. Т.е. когда нам просто надо поработать с
>> данными.
> 
>> Но всё же меня озадачивает, что следующий патч идёт как бы вразрез с этим
>> призывом -- он изживает unsigned long из всех методов класса DynamicMMap,
>> которые возвращают такие индексы.
> 
>> В ветке sisyphus_one_more_time в
>> git://git.altlinux.org/people/darktemplar/packages/apt.git коммит
>>
>> commit 971eae5c0248f6f849e1e989cab7244e33fbaf67
>> Author: Aleksei Nikiforov <darktemplar на altlinux.org>
>> Date:   Mon Jul 22 14:18:13 2019 +0300
>>
>>      dynamic memory management: Use same type for all offsets to dynamically allocated map
>>      
>>      Conformance update
>>      
>>      Change-Id: I5efcdb9e6604ad4e3f7329e590ab0b48e5400664
> 
> Тем самым, с одной стороны, это изменение не является по виду просто
> эквивалентным переписыванием имевшегося кода, которое однозначно не меняет
> поведение. (Когда раньше смотрел этот патч, я этого не осознавал, потому
> что не обращал внимание, что это два типа разного размера.)
> 
> С другой стороны, если поведение программы в каких-то местах может
> поменяться, из коммита непонятно, чем потенциальное новое поведение лучше
> старого.
> 

Здравствуй.

По поводу мыслей и замыслов других авторов, в том числе из Debian, я 
ничего сказать не могу. Такие вопросы точно не по адресу.

Далее по поводу данного патча и некоторых предыдущих патчей из серии.

Портируемые из Debian изменения, как и сделанные на их основе мной 
изменения, содержали unsigned long как до изменений, так и после. 
Поэтому я решил это не менять там. Поскольку индексы map_ptrloc и 
'unsigned long' указывают на смещение в одном и том же файле, делать их 
разными типами смысла никакого нет. Соответственно, я привёл в этом 
патче их к единому виду: map_ptrloc. Сейчас это typedef на 'unsigned 
int'. Делать map_ptrloc более длинным типом я причин пока что не вижу. 
Как минимум, пока файлы кэша не подходят близко к отметке в 4Гб. А вот 
минусы от такого изменения быть могут, и скорее всего будут, в виде 
увеличения потребления ресурсов.

Только что посмотрел код apt свежей версии из Debian. Там map_ptrloc 
заменили на map_stringitem_t, а unsigned long в данных случаях - на 
map_pointer_t, который является typedef на тот же самый 
map_stringitem_t, который в свою очередь всё ещё является typedef на 
32-битный int, который правда прописали как uint32_t.

>> diff --git a/apt/apt-pkg/contrib/mmap.cc b/apt/apt-pkg/contrib/mmap.cc
>> index 5e9cfbce9..743e35723 100644
>> --- a/apt/apt-pkg/contrib/mmap.cc
>> +++ b/apt/apt-pkg/contrib/mmap.cc
>> @@ -215,7 +215,7 @@ DynamicMMap::~DynamicMMap()
>>   // DynamicMMap::RawAllocate - Allocate a raw chunk of unaligned space	/*{{{*/
>>   // ---------------------------------------------------------------------
>>   /* This allocates a block of memory aligned to the given size */
>> -std::experimental::optional<unsigned long> DynamicMMap::RawAllocate(unsigned long long Size,unsigned long Aln)
>> +std::experimental::optional<map_ptrloc> DynamicMMap::RawAllocate(unsigned long long Size,unsigned long Aln)
>>   {
>>      unsigned long long Result = iSize;
>>      if (Aln != 0)
>> @@ -231,25 +231,25 @@ std::experimental::optional<unsigned long> DynamicMMap::RawAllocate(unsigned lon
>>                            "Current values are: %llu, %llu. (man 5 apt.conf)"),
>>                          (unsigned long long) _config->FindI("APT::Cache-Start", 24*1024*1024),
>>                          (unsigned long long) _config->FindI("APT::Cache-Limit", 0));
>> -         return std::experimental::optional<unsigned long>();
>> +         return std::experimental::optional<map_ptrloc>();
>>         }
>>      }
>>   
>>      iSize = Result + Size;
>>   
>> -   return std::experimental::optional<unsigned long>(Result);
>> +   return std::experimental::optional<map_ptrloc>(Result);
>>   }
>>   									/*}}}*/
>>   // DynamicMMap::Allocate - Pooled aligned allocation			/*{{{*/
>>   // ---------------------------------------------------------------------
>>   /* This allocates an Item of size ItemSize so that it is aligned to its
>>      size in the file. */
>> -std::experimental::optional<unsigned long> DynamicMMap::Allocate(unsigned long ItemSize)
>> +std::experimental::optional<map_ptrloc> DynamicMMap::Allocate(unsigned long ItemSize)
>>   {
>>      if (ItemSize == 0)
>>      {
>>         _error->Error("Can't allocate an item of size zero");
>> -      return std::experimental::optional<unsigned long>();
>> +      return std::experimental::optional<map_ptrloc>();
>>      }
>>   
>>      // Look for a matching pool entry
>> @@ -286,7 +286,7 @@ std::experimental::optional<unsigned long> DynamicMMap::Allocate(unsigned long I
>>         if (Empty == 0)
>>         {
>>   	 _error->Error("Ran out of allocation pools");
>> -	 return std::experimental::optional<unsigned long>();
>> +	 return std::experimental::optional<map_ptrloc>();
>>         }
>>         
>>         I = Empty;
>> @@ -316,13 +316,13 @@ std::experimental::optional<unsigned long> DynamicMMap::Allocate(unsigned long I
>>   
>>      I->Count--;
>>      I->Start += ItemSize;
>> -   return std::experimental::optional<unsigned long>(Result/ItemSize);
>> +   return std::experimental::optional<map_ptrloc>(Result/ItemSize);
>>   }
>>   									/*}}}*/
>>   // DynamicMMap::WriteString - Write a string to the file		/*{{{*/
>>   // ---------------------------------------------------------------------
>>   /* Strings are not aligned to anything */
>> -std::experimental::optional<unsigned long> DynamicMMap::WriteString(const char *String,
>> +std::experimental::optional<map_ptrloc> DynamicMMap::WriteString(const char *String,
>>   				       unsigned long Len)
>>   {
>>      if (Len == std::numeric_limits<unsigned long>::max())
>> @@ -331,7 +331,7 @@ std::experimental::optional<unsigned long> DynamicMMap::WriteString(const char *
>>      auto Result = RawAllocate(Len+1,0);
>>   
>>      if (Base == NULL || !Result)
>> -      return std::experimental::optional<unsigned long>();
>> +      return std::experimental::optional<map_ptrloc>();
>>   
>>      memcpy((char *)Base + *Result,String,Len);
>>      ((char *)Base)[*Result + Len] = 0;
>> diff --git a/apt/apt-pkg/contrib/mmap.h b/apt/apt-pkg/contrib/mmap.h
>> index cfeec12b1..e4f289a5c 100644
>> --- a/apt/apt-pkg/contrib/mmap.h
>> +++ b/apt/apt-pkg/contrib/mmap.h
>> @@ -101,10 +101,10 @@ class DynamicMMap : public MMap
>>      public:
>>   
>>      // Allocation
>> -   std::experimental::optional<unsigned long> RawAllocate(unsigned long long Size,unsigned long Aln = 0);
>> -   std::experimental::optional<unsigned long> Allocate(unsigned long ItemSize);
>> -   std::experimental::optional<unsigned long> WriteString(const char *String,unsigned long Len = std::numeric_limits<unsigned long>::max());
>> -   inline std::experimental::optional<unsigned long> WriteString(const string &S) {return WriteString(S.c_str(),S.length());};
>> +   std::experimental::optional<map_ptrloc> RawAllocate(unsigned long long Size,unsigned long Aln = 0);
>> +   std::experimental::optional<map_ptrloc> Allocate(unsigned long ItemSize);
>> +   std::experimental::optional<map_ptrloc> WriteString(const char *String,unsigned long Len = std::numeric_limits<unsigned long>::max());
>> +   inline std::experimental::optional<map_ptrloc> WriteString(const string &S) {return WriteString(S.c_str(),S.length());};
>>      void UsePools(Pool &P,unsigned int Count) {Pools = &P; PoolCount = Count;};
>>      
>>      DynamicMMap(FileFd &F,unsigned long Flags,unsigned long long WorkSpace = 2*1024*1024,
>> diff --git a/apt/apt-pkg/pkgcachegen.cc b/apt/apt-pkg/pkgcachegen.cc
>> index 36d54504e..4940ec6e5 100644
>> --- a/apt/apt-pkg/pkgcachegen.cc
>> +++ b/apt/apt-pkg/pkgcachegen.cc
>> @@ -525,15 +525,15 @@ bool pkgCacheGenerator::NewFileVer(pkgCache::VerIterator &Ver,
>>   // CacheGenerator::NewVersion - Create a new Version 			/*{{{*/
>>   // ---------------------------------------------------------------------
>>   /* This puts a version structure in the linked list */
>> -std::experimental::optional<unsigned long> pkgCacheGenerator::NewVersion(pkgCache::VerIterator &Ver,
>> +std::experimental::optional<map_ptrloc> pkgCacheGenerator::NewVersion(pkgCache::VerIterator &Ver,
>>   					    const string &VerStr,
>> -					    unsigned long Next)
>> +					    map_ptrloc Next)
>>   {
>>      // Get a structure
>>      const auto Version = AllocateInMap(sizeof(pkgCache::Version));
>>      const auto idxVerStr = WriteStringInMap(VerStr);
>>      if ((!Version) || (!idxVerStr))
>> -      return std::experimental::optional<unsigned long>();
>> +      return std::experimental::optional<map_ptrloc>();
>>      
>>      // Fill it in
>>      Ver = pkgCache::VerIterator(Cache,Cache.VerP + *Version);
>> @@ -710,7 +710,7 @@ bool pkgCacheGenerator::SelectFile(const string &File, const string &Site,
>>   // ---------------------------------------------------------------------
>>   /* This is used to create handles to strings. Given the same text it
>>      always returns the same number */
>> -std::experimental::optional<unsigned long> pkgCacheGenerator::WriteUniqString(const char *S,
>> +std::experimental::optional<map_ptrloc> pkgCacheGenerator::WriteUniqString(const char *S,
>>   						 unsigned int Size)
>>   {
>>      /* We use a very small transient hash table here, this speeds up generation
>> @@ -718,7 +718,7 @@ std::experimental::optional<unsigned long> pkgCacheGenerator::WriteUniqString(co
>>      pkgCache::StringItem *&Bucket = UniqHash[(S[0]*5 + S[1]) % _count(UniqHash)];
>>      if (Bucket != 0 &&
>>          stringcmp(S,S+Size,Cache.StrP + Bucket->String) == 0)
>> -      return std::experimental::optional<unsigned long>(Bucket->String);
>> +      return std::experimental::optional<map_ptrloc>(Bucket->String);
>>      
>>      // Search for an insertion point
>>      pkgCache::StringItem *I = Cache.StringItemP + Cache.HeaderP->StringList;
>> @@ -736,7 +736,7 @@ std::experimental::optional<unsigned long> pkgCacheGenerator::WriteUniqString(co
>>      if (Res == 0)
>>      {
>>         Bucket = I;
>> -      return std::experimental::optional<unsigned long>(I->String);
>> +      return std::experimental::optional<map_ptrloc>(I->String);
>>      }
>>      
>>      // Get a structure
>> @@ -744,7 +744,7 @@ std::experimental::optional<unsigned long> pkgCacheGenerator::WriteUniqString(co
>>      const auto Item = AllocateInMap(sizeof(pkgCache::StringItem));
>>      const auto idxString = WriteStringInMap(S, Size);
>>      if ((!Item) || (!idxString))
>> -      return std::experimental::optional<unsigned long>();
>> +      return std::experimental::optional<map_ptrloc>();
>>   
>>      if (oldMap != Map.Data())
>>      {
>> @@ -760,7 +760,7 @@ std::experimental::optional<unsigned long> pkgCacheGenerator::WriteUniqString(co
>>      ItemP->String = *idxString;
>>      
>>      Bucket = ItemP;
>> -   return std::experimental::optional<unsigned long>(ItemP->String);
>> +   return std::experimental::optional<map_ptrloc>(ItemP->String);
>>   }
>>   									/*}}}*/
>>   
>> diff --git a/apt/apt-pkg/pkgcachegen.h b/apt/apt-pkg/pkgcachegen.h
>> index dfcadbf8e..8a66765cc 100644
>> --- a/apt/apt-pkg/pkgcachegen.h
>> +++ b/apt/apt-pkg/pkgcachegen.h
>> @@ -116,15 +116,15 @@ class pkgCacheGenerator
>>      bool FoundFileDeps;
>>      
>>      bool NewFileVer(pkgCache::VerIterator &Ver,ListParser &List);
>> -   std::experimental::optional<unsigned long> NewVersion(pkgCache::VerIterator &Ver,const string &VerStr,unsigned long Next);
>> +   std::experimental::optional<map_ptrloc> NewVersion(pkgCache::VerIterator &Ver,const string &VerStr, map_ptrloc Next);
>>   
>>      public:
>>   
>>      // CNC:2003-02-27 - We need this in rpmListParser.
>>      bool NewPackage(pkgCache::PkgIterator &PkgI,const string &Pkg);
>>   
>> -   std::experimental::optional<unsigned long> WriteUniqString(const char *S,unsigned int Size);
>> -   inline std::experimental::optional<unsigned long> WriteUniqString(const string &S) {return WriteUniqString(S.c_str(),S.length());};
>> +   std::experimental::optional<map_ptrloc> WriteUniqString(const char *S,unsigned int Size);
>> +   inline std::experimental::optional<map_ptrloc> WriteUniqString(const string &S) {return WriteUniqString(S.c_str(),S.length());};
>>   
>>      void DropProgress() {Progress = 0;};
>>      bool SelectFile(const string &File,const string &Site,pkgIndexFile const &Index,
>> @@ -162,10 +162,10 @@ class pkgCacheGenerator::ListParser
>>      pkgCacheGenerator *Owner;
>>      friend class pkgCacheGenerator;
>>   
>> -   inline std::experimental::optional<unsigned long> WriteUniqString(const string &S) {return Owner->WriteUniqString(S);};
>> -   inline std::experimental::optional<unsigned long> WriteUniqString(const char *S,unsigned int Size) {return Owner->WriteUniqString(S,Size);};
>> -   inline std::experimental::optional<unsigned long> WriteString(const string &S) {return Owner->WriteStringInMap(S);};
>> -   inline std::experimental::optional<unsigned long> WriteString(const char *S,unsigned int Size) {return Owner->WriteStringInMap(S,Size);};
>> +   inline std::experimental::optional<map_ptrloc> WriteUniqString(const string &S) {return Owner->WriteUniqString(S);};
>> +   inline std::experimental::optional<map_ptrloc> WriteUniqString(const char *S,unsigned int Size) {return Owner->WriteUniqString(S,Size);};
>> +   inline std::experimental::optional<map_ptrloc> WriteString(const string &S) {return Owner->WriteStringInMap(S);};
>> +   inline std::experimental::optional<map_ptrloc> WriteString(const char *S,unsigned int Size) {return Owner->WriteStringInMap(S,Size);};
>>      bool NewDepends(pkgCache::VerIterator &Ver, const string &Package,
>>   		   const string &Version,unsigned int Op,
>>   		   unsigned int Type);
>> diff --git a/apt/apt-pkg/rpm/rpmlistparser.cc b/apt/apt-pkg/rpm/rpmlistparser.cc
>> index 0cbb5f750..ea27d11c5 100644
>> --- a/apt/apt-pkg/rpm/rpmlistparser.cc
>> +++ b/apt/apt-pkg/rpm/rpmlistparser.cc
>> @@ -75,7 +75,7 @@ rpmListParser::~rpmListParser()
>>   // ListParser::UniqFindTagWrite - Find the tag and write a unq string	/*{{{*/
>>   // ---------------------------------------------------------------------
>>   /* */
>> -std::experimental::optional<unsigned long> rpmListParser::UniqFindTagWrite(int Tag)
>> +std::experimental::optional<map_ptrloc> rpmListParser::UniqFindTagWrite(int Tag)
>>   {
>>      char *Start;
>>      char *Stop;
>> @@ -90,7 +90,7 @@ std::experimental::optional<unsigned long> rpmListParser::UniqFindTagWrite(int T
>>          * But since cacheiterators treat zero as special value,
>>          * just pass it instead of failing
>>          */
>> -      return std::experimental::optional<unsigned long>(0);
>> +      return std::experimental::optional<map_ptrloc>(0);
>>      }
>>      
>>      if (type == RPM_STRING_TYPE)
>> diff --git a/apt/apt-pkg/rpm/rpmlistparser.h b/apt/apt-pkg/rpm/rpmlistparser.h
>> index 6767d106d..22a90a0a5 100644
>> --- a/apt/apt-pkg/rpm/rpmlistparser.h
>> +++ b/apt/apt-pkg/rpm/rpmlistparser.h
>> @@ -45,7 +45,7 @@ class rpmListParser : public pkgCacheGenerator::ListParser
>>   
>>      bool Duplicated;
>>      
>> -   std::experimental::optional<unsigned long> UniqFindTagWrite(int Tag);
>> +   std::experimental::optional<map_ptrloc> UniqFindTagWrite(int Tag);
>>      bool ParseStatus(pkgCache::PkgIterator &Pkg,pkgCache::VerIterator &Ver);
>>      bool ParseDepends(pkgCache::VerIterator &Ver,
>>   		     char **namel, char **verl, int32_t *flagl,
>>
>> -- 
>> Best regards,
>> Ivan
>>
>> _______________________________________________
>> Devel mailing list
>> Devel на lists.altlinux.org
>> https://lists.altlinux.org/mailman/listinfo/devel


Подробная информация о списке рассылки Devel